期刊文献+
共找到529篇文章
< 1 2 27 >
每页显示 20 50 100
基于ElasticSearch的医疗数据检索系统的设计与实现
1
作者 汪睿 胡外光 +1 位作者 胡珊珊 周颖 《信息技术》 2024年第4期76-82,共7页
随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearc... 随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearch的医疗数据检索系统。该系统将医疗数据进行标准化,填补缺失值,选取合适的分词算法进行分词,将处理后的数据存入ElasticSearch中,同时使用SpringBoot构建系统应用,消耗多个医疗基础业务系统产生的数据,最终形成统一的医疗数据检索系统,给用户提供便捷、精确的查询服务。 展开更多
关键词 lasticsearch 医疗数据 文本分词 全文检索 分布式搜索
下载PDF
Application of Full Text Search Engine Based on Lucene
2
作者 Rujia Gao Danying Li +1 位作者 Wanlong Li Yaze Dong 《Advances in Internet of Things》 2012年第4期106-109,共4页
This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retri... This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retrieval’s response time, the experimental results show that the full text search of Lucene has faster retrieval speed. 展开更多
关键词 Full text search ENGINE System ARCHITECTURE LUCENE
下载PDF
On Multi-Thread Crawler Optimization for Scalable Text Searching
3
作者 Guang Sun Huanxin Xiang Shuanghu Li 《Journal on Big Data》 2019年第2期89-106,共18页
Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the w... Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the world,records the realtime news that occurs every day,and provides users with a good database of data,but because of the large amount of data,it puts a lot of pressure on users to search.At present,single-threaded crawling data can no longer meet the requirements of text crawling.In order to improve the performance and program versatility of single-threaded crawlers,a high-speed multi-threaded web crawler is designed to crawl the network hyper-scale text database.Multi-threaded crawling uses multiple threads to process web pages in parallel,combining breadth-first and depth-first algorithms to control web crawling.The practice project is based on the Python language to achieve multi-threaded optimization network hyper-large-scale text database-Wikipedia book crawling method,the project is inspired by the article on the Wikipedia article in the Big Data Digest public number. 展开更多
关键词 MULTI-THREADING text database OPTIMIZATION breadth-first search depth-first search.
下载PDF
An Efficient Character-Level Adversarial Attack Inspired by Textual Variations in Online Social Media Platforms
4
作者 Jebran Khan Kashif Ahmad Kyung-Ah Sohn 《Computer Systems Science & Engineering》 SCIE EI 2023年第12期2869-2894,共26页
In recent years,the growing popularity of social media platforms has led to several interesting natural language processing(NLP)applications.However,these social media-based NLP applications are subject to different t... In recent years,the growing popularity of social media platforms has led to several interesting natural language processing(NLP)applications.However,these social media-based NLP applications are subject to different types of adversarial attacks due to the vulnerabilities of machine learning(ML)and NLP techniques.This work presents a new low-level adversarial attack recipe inspired by textual variations in online social media communication.These variations are generated to convey the message using out-of-vocabulary words based on visual and phonetic similarities of characters and words in the shortest possible form.The intuition of the proposed scheme is to generate adversarial examples influenced by human cognition in text generation on social media platforms while preserving human robustness in text understanding with the fewest possible perturbations.The intentional textual variations introduced by users in online communication motivate us to replicate such trends in attacking text to see the effects of such widely used textual variations on the deep learning classifiers.In this work,the four most commonly used textual variations are chosen to generate adversarial examples.Moreover,this article introduced a word importance ranking-based beam search algorithm as a searching method for the best possible perturbation selection.The effectiveness of the proposed adversarial attacks has been demonstrated on four benchmark datasets in an extensive experimental setup. 展开更多
关键词 Adversarial attack text classification social media character-level attack phonetic similarity visual similarity word importance rank beam search
下载PDF
基于ElasticSearch分布式搜索引擎的信息检索方法研究
5
作者 董元和 贾炎 +2 位作者 朱勇 李恩泽 薛贤红 《湖北师范大学学报(自然科学版)》 2023年第4期56-61,共6页
随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引... 随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引擎,并采用分词器和倒排索引等技术,能较好地解决这些问题。同时在研究过程中利用代码实现了基础功能搜索、地理位置搜索以及通过算分排序推荐展示等功能。 展开更多
关键词 分布式搜索引擎 短文本搜索 倒排索引 分词器 信息检索
下载PDF
基于实时同步和全文搜索技术的方剂学多维实训平台
6
作者 魏培阳 史晓雨 +3 位作者 周杰三 邢晓方 梁佳豪 刘洋 《现代电子技术》 北大核心 2024年第2期67-73,共7页
针对中医方剂学存在的数据量大、类型多样、学习识记困难等问题,提出一种改进的基于实时同步和全文搜索算法的方剂学多维实训平台(MTPF)。分析MTPF系统需求并搭建基础框架,采用Canal同步数据和ElasticSearch提供全文搜索服务,以保证业... 针对中医方剂学存在的数据量大、类型多样、学习识记困难等问题,提出一种改进的基于实时同步和全文搜索算法的方剂学多维实训平台(MTPF)。分析MTPF系统需求并搭建基础框架,采用Canal同步数据和ElasticSearch提供全文搜索服务,以保证业务应用的效率和性能;结合MTPF业务领域问题,提出针对具体业务的可配置和过滤的同步算法,构建面向搜索的自定义分词词典优化算法。通过系统应用及对比实验,验证了改进算法能够满足MTPF的需求;通过与其他框架的对比实验,证明了改进算法在同步时延、资源消耗、搜索速度等方面均取得了良好的效果,保障了业务数据信息在传输、存储、同步、搜索等环节的性能。 展开更多
关键词 方剂学多维实训平台 实时同步 全文搜索 Elasticsearch CANAL REDIS MySQL
下载PDF
Oracle Text技术在复杂结构数据库中的应用 被引量:5
7
作者 蒙辉 陈燕 《计算机技术与发展》 2007年第4期38-40,44,共4页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。 展开更多
关键词 ORACLE text 复杂结构数据库 全文检索
下载PDF
一种新型高效全文检索引擎的设计
8
作者 董宗然 闻柏智 朱毅 《软件工程》 2024年第2期44-48,共5页
为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中... 为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中主键形成的映射查询数据,然后通过相关度算法对这些数据进行排序,并以字典树作为搜索提示,实现高效的全文检索。实验结果表明:与ElasticSearch使用相同词集时,随着测试数据量的变化,所设计的全文检索引擎的查询效率是ElasticSearch效率的80~1200倍,其效率优势随着数据量增加呈现反比例关系变化,并且在17919条文档数据下,其内存占用不超过2.5 GB,适合用于海量文档数据检索。 展开更多
关键词 倒排索引 全文检索 检索引擎 模糊查询 字典树
下载PDF
基于Lucene的MYSearch全文搜索引擎
9
作者 刘亚姝 黄岳 《微型机与应用》 2010年第18期86-88,共3页
基于Lucene开源框架设计实现了MYSearch全文搜索引擎。给出了MYSearch实现的基本原理和设计流程,以及实验结果,并针对Lucene在中文分词方面的不足展开了讨论,给出了改进方法。
关键词 全文搜索引擎 Lucence 分词 索引
下载PDF
基于大数据技术的高职院校全量数据资源池的建设与实践
10
作者 靳晓娟 《信息与电脑》 2024年第3期232-234,共3页
各高职院校智慧校园建设均取得了一定成就,积累了大量的数据。在此背景下,全量数据资源池的建设得到高职院校的关注。文章对现阶段数据建设方面的问题进行分析,并探讨全量数据资源池建设的重点任务、建设思路及应用价值,为高职院校决策... 各高职院校智慧校园建设均取得了一定成就,积累了大量的数据。在此背景下,全量数据资源池的建设得到高职院校的关注。文章对现阶段数据建设方面的问题进行分析,并探讨全量数据资源池建设的重点任务、建设思路及应用价值,为高职院校决策分析、教学科研、管理服务提供全维度、高质量的数据引擎,推动高职院校高质量发展。 展开更多
关键词 高职院校 全量数据资源池 全域数据采集 全文搜索引擎
下载PDF
基于Microsoft Search Service为图书馆自建数据库创建Web全文检索系统
11
作者 唐光前 《现代图书情报技术》 CSSCI 北大核心 2003年第6期50-52,共3页
分析了基于 Microsoft Search Service为图书馆自建数据库创建 Web全文检索系统的理由、Microsoft SearchService的索引机制和检索机制 ,并运用 ASP.
关键词 Microsoft-search-Service 图书馆 数据库 全文检索系统 索引机制 检索机制 ASP NET
下载PDF
基于MapReduce集群框架的外观专利检索系统设计
12
作者 孙惠芬 《镇江高专学报》 2024年第2期77-81,共5页
基于MapReduce集群框架的外观专利检索系统设计旨在提高专利检索的效率和准确性。该系统以Hadoop分布式文件系统(HDFS)为存储基础,利用MapReduce并行计算模型实现专利数据的快速处理和检索。通过搭建Linux集群环境和分布式计算平台Hado... 基于MapReduce集群框架的外观专利检索系统设计旨在提高专利检索的效率和准确性。该系统以Hadoop分布式文件系统(HDFS)为存储基础,利用MapReduce并行计算模型实现专利数据的快速处理和检索。通过搭建Linux集群环境和分布式计算平台Hadoop,系统能有效加速外观专利检索,提高检索效率和准确性。 展开更多
关键词 外观专利检索系统 MapReduce集群框架 图像检索 全文检索技术
下载PDF
利用interMedia-Text实现基于Web的大型文档库的全文检索模块 被引量:2
13
作者 夏戈 卜家岐 《计算机应用与软件》 CSCD 北大核心 2004年第1期22-23,102,共3页
随着电子文档的大量使用 ,如何建立高效的文档管理系统成为一个新的研究方向。本文就实现管理系统的一项技术难点 ,即大型文档的全文检索功能 ,提出了一种新的可行方案。其核心选用了最新的数据库技术interMedia -Text 。
关键词 数据库 interMedia-text WEB 大型文档库 全文检索模块 文档管理系统
下载PDF
提高发明专利授权率的策略研究
14
作者 杨凯 《科技创新与生产力》 2024年第4期45-48,共4页
为了提高发明专利申请的成功率,本文从查新检索、文本撰稿以及审通答复3个方面分别进行了详细的阐述。一是通过查新检索对专利的授权前景进行预判;二是通过文本撰稿确保专利的技术方案可以实现;三是通过审通答复确定专利改进点的非显而... 为了提高发明专利申请的成功率,本文从查新检索、文本撰稿以及审通答复3个方面分别进行了详细的阐述。一是通过查新检索对专利的授权前景进行预判;二是通过文本撰稿确保专利的技术方案可以实现;三是通过审通答复确定专利改进点的非显而易见。经过上述3个方面分析,为申请人在申报专利时提供一定的技术启示。 展开更多
关键词 发明授权率 查新检索 文本撰稿 审通答复
下载PDF
面向工程数据检索的ElasticSearch索引优化策略 被引量:8
15
作者 许贤慧 王淑营 曾文驱 《计算机与现代化》 2022年第2期79-84,119,共7页
随着生产制造业的发展,各行业在生产制造的过程中都会产生大量的工程数据,现代工程领域的数据检索需求要求能够通过关键字快速且准确检索出相应的结果,利用ElasticSearch可以实现工程数据的检索,但是其性能方面还有优化的空间。为了解... 随着生产制造业的发展,各行业在生产制造的过程中都会产生大量的工程数据,现代工程领域的数据检索需求要求能够通过关键字快速且准确检索出相应的结果,利用ElasticSearch可以实现工程数据的检索,但是其性能方面还有优化的空间。为了解决这个问题,本文对ElasticSearch的底层原理进行深入研究,在ElasticSearch的索引创建、索引分片以及索引段合并方面进行优化。首先对ElasticSearch的分词器进行修改并配置自定义词典,其次提出基于集群节点性能与索引数据量大小的索引分片策略,最后,根据节点性能对索引段合并的时机进行优化。通过基于地铁工程数据的检索进行实验,实验结果表明,改进的方法确实能够提高ElasticSearch的数据写入与查询性能。 展开更多
关键词 Elasticsearch全文搜索引擎 索引 分片 段合并 性能优化
下载PDF
语义检索技术在电商搜索中的应用研究
16
作者 赵小娟 《福建电脑》 2024年第6期54-58,共5页
在电商搜索场景下,用户检索的语义模糊和商品标题信息的繁杂冗余,使得基于文本相似度匹配的检索算法无法满足用户检索的需求。针对这种情况,本文基于阿里巴巴淘宝电商开源的业务数据,探索了基于深度学习和对比学习的文本语义向量技术在... 在电商搜索场景下,用户检索的语义模糊和商品标题信息的繁杂冗余,使得基于文本相似度匹配的检索算法无法满足用户检索的需求。针对这种情况,本文基于阿里巴巴淘宝电商开源的业务数据,探索了基于深度学习和对比学习的文本语义向量技术在电商搜索场景下的应用,并提出了模型领域自适应的训练方式和一种差异化多层次的数据增强方式。实验的结果表明,基于文本语义向量检索技术明显优于传统的基于文本相似度匹配的检索算法,模型领域自适应的训练方式和差异化多层次的数据增强方式能够显著提升商品召回的效果。 展开更多
关键词 电商搜索 语义检索 文本语义向量 检索算法
下载PDF
基于ElasticSearch全文检索的农业地理信息大数据平台设计与实现 被引量:3
17
作者 刘吉 孙俊英 +1 位作者 陈忠超 蔡忠亮 《测绘与空间地理信息》 2021年第6期162-164,共3页
针对目前农业大数据平台地理要素纳入不足、研究尺度受限、搜索功能相对薄弱等问题,本文充分发挥了测绘部门自然地理要素数据精细、农业遥感监测数据精准、野外全景采样数据完整的优势,基于ElasticSearch搜索引擎,利用网络技术、电子地... 针对目前农业大数据平台地理要素纳入不足、研究尺度受限、搜索功能相对薄弱等问题,本文充分发挥了测绘部门自然地理要素数据精细、农业遥感监测数据精准、野外全景采样数据完整的优势,基于ElasticSearch搜索引擎,利用网络技术、电子地图技术与空间数据库技术设计并实现了全文检索的农业地理信息大数据平台,多角度、多维度、多层次精确地展示数据信息内容,为农业大数据的规律寻找、价值挖掘与有效利用提供了有力支撑。 展开更多
关键词 农业大数据 地理信息平台 Elasticsearch 全文检索
下载PDF
Oracle Text全文检索技术在文档资料管理中的应用 被引量:3
18
作者 李培军 毕于慧 +1 位作者 张权 董玮 《计算机系统应用》 2014年第4期57-60,共4页
本文利用Oracle Text全文检索技术,根据数据库业务逻辑构建了关键词表,通过为关键词表建立索引的方式进行检索,提高了检索效率;以ViusalC++6为开发平台,采用C/S结构技术研发了多类型文档资料管理系统,实现了办公文档资料的高效管理.
关键词 全文检索 文档资料管理系统
下载PDF
一种基于Context Graph主题爬虫系统的算法实现 被引量:1
19
作者 高庆芳 蒲宝卿 包蕾 《兰州文理学院学报(自然科学版)》 2022年第6期41-45,共5页
对搜索引擎的原理结构进行深度剖析,经可行性认定后,将机器学习算法与现有的技术手段进一步融合提升,以Python为开发平台,以Context Graph为开发主题,构建并设计出可实现的目标爬虫系统.通过实际运用检测系统的实用性能,选择国内具有较... 对搜索引擎的原理结构进行深度剖析,经可行性认定后,将机器学习算法与现有的技术手段进一步融合提升,以Python为开发平台,以Context Graph为开发主题,构建并设计出可实现的目标爬虫系统.通过实际运用检测系统的实用性能,选择国内具有较大规模的汽车网站为研究对象,设置“汽车”为关键词对全部内容展开不同类别的爬取,进而分析所得结果,根据查全率、查准率和F1值综合评价系统的性能.与原有系统相比,升级后算法的模型准确性更好,在一定程度上提高爬取工作的效率. 展开更多
关键词 搜索引擎 主题爬虫 文本分析 机器学习
下载PDF
基于Elasticsearch的校内全文搜索平台的研究与实现 被引量:4
20
作者 钦蒋承 沈宏良 《现代计算机》 2018年第23期96-100,共5页
为了解决校园网域内的数字资源无法精确定位和获取问题,对搜索引擎的工作原理和Elasticsearch(ES)的运行机制进行深入研究,实现提供多文件类型的实时全文搜索服务平台,并对ES的中文索引缺陷进行优化。实验结果表明,相比于通用的搜索引... 为了解决校园网域内的数字资源无法精确定位和获取问题,对搜索引擎的工作原理和Elasticsearch(ES)的运行机制进行深入研究,实现提供多文件类型的实时全文搜索服务平台,并对ES的中文索引缺陷进行优化。实验结果表明,相比于通用的搜索引擎和基于内容管理的搜索引擎,所实现的搜索引擎能够更快速、准确、全面地完成校内用户的搜索需求。 展开更多
关键词 搜索引擎 Elasticsearch 中文索引 相关度计算 全文搜索
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部