期刊文献+
共找到534篇文章
< 1 2 27 >
每页显示 20 50 100
基于ElasticSearch的医疗数据检索系统的设计与实现
1
作者 汪睿 胡外光 +1 位作者 胡珊珊 周颖 《信息技术》 2024年第4期76-82,共7页
随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearc... 随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearch的医疗数据检索系统。该系统将医疗数据进行标准化,填补缺失值,选取合适的分词算法进行分词,将处理后的数据存入ElasticSearch中,同时使用SpringBoot构建系统应用,消耗多个医疗基础业务系统产生的数据,最终形成统一的医疗数据检索系统,给用户提供便捷、精确的查询服务。 展开更多
关键词 lasticsearch 医疗数据 文本分词 全文检索 分布式搜索
下载PDF
An Efficient Character-Level Adversarial Attack Inspired by Textual Variations in Online Social Media Platforms
2
作者 Jebran Khan Kashif Ahmad Kyung-Ah Sohn 《Computer Systems Science & Engineering》 SCIE EI 2023年第12期2869-2894,共26页
In recent years,the growing popularity of social media platforms has led to several interesting natural language processing(NLP)applications.However,these social media-based NLP applications are subject to different t... In recent years,the growing popularity of social media platforms has led to several interesting natural language processing(NLP)applications.However,these social media-based NLP applications are subject to different types of adversarial attacks due to the vulnerabilities of machine learning(ML)and NLP techniques.This work presents a new low-level adversarial attack recipe inspired by textual variations in online social media communication.These variations are generated to convey the message using out-of-vocabulary words based on visual and phonetic similarities of characters and words in the shortest possible form.The intuition of the proposed scheme is to generate adversarial examples influenced by human cognition in text generation on social media platforms while preserving human robustness in text understanding with the fewest possible perturbations.The intentional textual variations introduced by users in online communication motivate us to replicate such trends in attacking text to see the effects of such widely used textual variations on the deep learning classifiers.In this work,the four most commonly used textual variations are chosen to generate adversarial examples.Moreover,this article introduced a word importance ranking-based beam search algorithm as a searching method for the best possible perturbation selection.The effectiveness of the proposed adversarial attacks has been demonstrated on four benchmark datasets in an extensive experimental setup. 展开更多
关键词 Adversarial attack text classification social media character-level attack phonetic similarity visual similarity word importance rank beam search
下载PDF
基于ElasticSearch的输变电工程全文检索研究
3
作者 张建广 徐鲲 +3 位作者 董鉥涛 刘迪 王向上 李春林 《黑龙江科学》 2024年第16期94-97,共4页
随着输变电工程建设工作的开展,多源异构的全过程非结构化文档体量日益增大,需要对这些非结构化文档进行稳定管理。为实现输变电工程非结构化文档的高效检索,研究了基于ElasticSearch的输变电工程全文检索方案,构建电网专用术语词典对... 随着输变电工程建设工作的开展,多源异构的全过程非结构化文档体量日益增大,需要对这些非结构化文档进行稳定管理。为实现输变电工程非结构化文档的高效检索,研究了基于ElasticSearch的输变电工程全文检索方案,构建电网专用术语词典对智能化分词进行辅助优化,融合输变电工程资料的特征信息,对分词成果进行语义赋值,基于语义标签改进分词算法,进一步提升全文检索效率和准确率,搭建了输变电工程全文检索系统,以验证此技术方案的可行性。 展开更多
关键词 输变电工程 全文检索 Elasticsearch 中文分词 语义检索
下载PDF
On Multi-Thread Crawler Optimization for Scalable Text Searching
4
作者 Guang Sun Huanxin Xiang Shuanghu Li 《Journal on Big Data》 2019年第2期89-106,共18页
Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the w... Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the world,records the realtime news that occurs every day,and provides users with a good database of data,but because of the large amount of data,it puts a lot of pressure on users to search.At present,single-threaded crawling data can no longer meet the requirements of text crawling.In order to improve the performance and program versatility of single-threaded crawlers,a high-speed multi-threaded web crawler is designed to crawl the network hyper-scale text database.Multi-threaded crawling uses multiple threads to process web pages in parallel,combining breadth-first and depth-first algorithms to control web crawling.The practice project is based on the Python language to achieve multi-threaded optimization network hyper-large-scale text database-Wikipedia book crawling method,the project is inspired by the article on the Wikipedia article in the Big Data Digest public number. 展开更多
关键词 MULTI-THREADING text database OPTIMIZATION breadth-first search depth-first search.
下载PDF
利用interMedia-Text实现基于Web的大型文档库的全文检索模块 被引量:2
5
作者 夏戈 卜家岐 《计算机应用与软件》 CSCD 北大核心 2004年第1期22-23,102,共3页
随着电子文档的大量使用 ,如何建立高效的文档管理系统成为一个新的研究方向。本文就实现管理系统的一项技术难点 ,即大型文档的全文检索功能 ,提出了一种新的可行方案。其核心选用了最新的数据库技术interMedia -Text 。
关键词 数据库 interMedia-text WEB 大型文档库 全文检索模块 文档管理系统
下载PDF
A Tabu Search Algorithm for Quadratic 0-1 Programming Problem 被引量:2
6
作者 周贤伟 王远允 +1 位作者 田新现 郭瑞强 《Chinese Quarterly Journal of Mathematics》 CSCD 1997年第4期98-102, ,共5页
In this paper,quadratic 0-1 programming problem (I) is considered, in terms of its features quadratic 0-1 programming problem is solved by linear approxity heurstic algrothm and a developed tabu search ahgrothm .
关键词 Tabu search linear approximate quaratic 0-1 programming
下载PDF
Application of Full Text Search Engine Based on Lucene
7
作者 Rujia Gao Danying Li +1 位作者 Wanlong Li Yaze Dong 《Advances in Internet of Things》 2012年第4期106-109,共4页
This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retri... This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retrieval’s response time, the experimental results show that the full text search of Lucene has faster retrieval speed. 展开更多
关键词 Full text search ENGINE System ARCHITECTURE LUCENE
下载PDF
The Forming Conditions of and Ore-searching Direction for B, Mg,Pb, Zn and Au Deposits in the Liaoji Proterozoic Rift
8
作者 Zhu Yongzheng and Yao Fengliang (College of Earth Sciences,Jilin University, Changchun 130026 P. R. China) 《Global Geology》 2001年第1期20-25,共6页
The Liaoji Proterozoic rift is an inter-intracontinenatl rift developed from Archean granite-greenstone tectonic regime and contains many important mineral deposits of U, B, magnesite, Pb-Zn, Au, Ag, Co and P. These d... The Liaoji Proterozoic rift is an inter-intracontinenatl rift developed from Archean granite-greenstone tectonic regime and contains many important mineral deposits of U, B, magnesite, Pb-Zn, Au, Ag, Co and P. These deposits were formed as the result of late mobilization, transportation and concentfation of the previously enriched ore-forming mate- rials in several ore-bearing formations formed during the rift stage. So the metallogeny of these deposits in the rift shows both inheritance and new generation of the ore-forming materials. In future ore-searching practice, attentions should be paid on the studies of the ore-bearing formations in the rift, on the multiple stages of metallogeny and and on multiple derivations of the ore-forming materials. 展开更多
关键词 Liaoji PROTEROZOIC rift B Mg Pb - Zn AU deposits ORE - forming conditions ORE - searchING direction
下载PDF
基于ElasticSearch分布式搜索引擎的信息检索方法研究 被引量:2
9
作者 董元和 贾炎 +2 位作者 朱勇 李恩泽 薛贤红 《湖北师范大学学报(自然科学版)》 2023年第4期56-61,共6页
随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引... 随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引擎,并采用分词器和倒排索引等技术,能较好地解决这些问题。同时在研究过程中利用代码实现了基础功能搜索、地理位置搜索以及通过算分排序推荐展示等功能。 展开更多
关键词 分布式搜索引擎 短文本搜索 倒排索引 分词器 信息检索
下载PDF
基于SSA-SVM的营养健康信息文本分类研究
10
作者 刘蕾 田鑫宇 朱大洲 《计算机时代》 2023年第6期82-86,91,共6页
为了能够快速、便捷地提取互联网中有关食物营养健康相关信息,针对传统文本分类算法的不足,利用麻雀搜索算法(SSA)良好的寻优能力对支持向量机(SVM)的最优参数组合进行搜索,提出一种基于SSA-SVM的文本分类方法。对SSA-SVM模型在不同的... 为了能够快速、便捷地提取互联网中有关食物营养健康相关信息,针对传统文本分类算法的不足,利用麻雀搜索算法(SSA)良好的寻优能力对支持向量机(SVM)的最优参数组合进行搜索,提出一种基于SSA-SVM的文本分类方法。对SSA-SVM模型在不同的数据集中的分类效果进行了试验研究,结果表明,SSA全局寻优性能稳定,可有效降低SVM参数选取对系统泛化能力和分类精度的影响,SSA-SVM模型在营养健康文本分类中准确率可达到83.8%,对食物营养健康信息挖掘研究具有一定的参考价值。 展开更多
关键词 营养健康 文本分类 支持向量机 麻雀搜索算法
下载PDF
基于实时同步和全文搜索技术的方剂学多维实训平台 被引量:1
11
作者 魏培阳 史晓雨 +3 位作者 周杰三 邢晓方 梁佳豪 刘洋 《现代电子技术》 北大核心 2024年第2期67-73,共7页
针对中医方剂学存在的数据量大、类型多样、学习识记困难等问题,提出一种改进的基于实时同步和全文搜索算法的方剂学多维实训平台(MTPF)。分析MTPF系统需求并搭建基础框架,采用Canal同步数据和ElasticSearch提供全文搜索服务,以保证业... 针对中医方剂学存在的数据量大、类型多样、学习识记困难等问题,提出一种改进的基于实时同步和全文搜索算法的方剂学多维实训平台(MTPF)。分析MTPF系统需求并搭建基础框架,采用Canal同步数据和ElasticSearch提供全文搜索服务,以保证业务应用的效率和性能;结合MTPF业务领域问题,提出针对具体业务的可配置和过滤的同步算法,构建面向搜索的自定义分词词典优化算法。通过系统应用及对比实验,验证了改进算法能够满足MTPF的需求;通过与其他框架的对比实验,证明了改进算法在同步时延、资源消耗、搜索速度等方面均取得了良好的效果,保障了业务数据信息在传输、存储、同步、搜索等环节的性能。 展开更多
关键词 方剂学多维实训平台 实时同步 全文搜索 Elasticsearch CANAL REDIS MySQL
下载PDF
Oracle Text技术在复杂结构数据库中的应用 被引量:5
12
作者 蒙辉 陈燕 《计算机技术与发展》 2007年第4期38-40,44,共4页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。 展开更多
关键词 ORACLE text 复杂结构数据库 全文检索
下载PDF
一种新型高效全文检索引擎的设计
13
作者 董宗然 闻柏智 朱毅 《软件工程》 2024年第2期44-48,共5页
为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中... 为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中主键形成的映射查询数据,然后通过相关度算法对这些数据进行排序,并以字典树作为搜索提示,实现高效的全文检索。实验结果表明:与ElasticSearch使用相同词集时,随着测试数据量的变化,所设计的全文检索引擎的查询效率是ElasticSearch效率的80~1200倍,其效率优势随着数据量增加呈现反比例关系变化,并且在17919条文档数据下,其内存占用不超过2.5 GB,适合用于海量文档数据检索。 展开更多
关键词 倒排索引 全文检索 检索引擎 模糊查询 字典树
下载PDF
企业级全文搜索系统设计与实现
14
作者 王盛义 刘顺章 《信息技术与标准化》 2024年第7期105-109,共5页
为解决企业内部信息资源难以被快速精确检索和有效利用、全文检索时数据访问权限控制问题,提出一种全文搜索系统数据访问权限控制模型,并设计了企业级全文搜索系统,阐述了企业级全文搜索系统的架构及其数据同步模块、数据索引模块、数... 为解决企业内部信息资源难以被快速精确检索和有效利用、全文检索时数据访问权限控制问题,提出一种全文搜索系统数据访问权限控制模型,并设计了企业级全文搜索系统,阐述了企业级全文搜索系统的架构及其数据同步模块、数据索引模块、数据搜索模块、权限控制模块等重要模块的设计与实现。该系统能在用户权限范围内对数据进行全文检索,有效实现对企业信息资源进行统一整合和检索,提高企业信息资源利用效率。 展开更多
关键词 Elasticsearch 全文搜索 分词检索 访问控制 企业搜索
下载PDF
基于局部搜索机制的K-Means聚类算法 被引量:2
15
作者 孙越恒 李志圣 何丕廉 《计算机工程》 CAS CSCD 北大核心 2008年第11期15-17,共3页
K-Means聚类算法的结果质量依赖于初始聚类中心的选择。该文将局部搜索的思想引入K-Means算法,提出一种改进的KMLS算法。该算法对K-Means收敛后的结果使用局部搜索来使其跳出局部极值点,进而再次迭代求优。同时对局部搜索的结果使用K-Me... K-Means聚类算法的结果质量依赖于初始聚类中心的选择。该文将局部搜索的思想引入K-Means算法,提出一种改进的KMLS算法。该算法对K-Means收敛后的结果使用局部搜索来使其跳出局部极值点,进而再次迭代求优。同时对局部搜索的结果使用K-Means算法使其尽快到达一个局部极值点。理论分析证明了算法的可行性和有效性,而在标准文本集上的文本聚类实验表明,相对于传统的K-Means算法,该算法改进了聚类结果的质量。 展开更多
关键词 K-MEANS聚类算法 局部搜索机制 KMLS算法 文本聚类
下载PDF
聚类加权和CS-LSSVM的文本分类 被引量:4
16
作者 赵专政 李云翔 《计算机工程与应用》 CSCD 2013年第16期124-128,共5页
文本特征提取和分类器优化是文本分类的两个关键问题,为了提高文本分类正确率,提出一种聚类加权(CW)和布谷鸟(CS)算法优化最小二乘支持向量机(LSSVM)的文本分类模型。采用TF-IDF算法计算特征词的权重,根据特征词的位置进行加权,经过特... 文本特征提取和分类器优化是文本分类的两个关键问题,为了提高文本分类正确率,提出一种聚类加权(CW)和布谷鸟(CS)算法优化最小二乘支持向量机(LSSVM)的文本分类模型。采用TF-IDF算法计算特征词的权重,根据特征词的位置进行加权,经过特征聚类处理降低特征冗余度,采用LSSVM建立文本分类器,采用CS算法对LSSVM参数进行优化。采用复旦大学语料库对模型性能进行仿真测试,仿真结果表明,模型不仅提高了文本分类的正确率,而且提高了文本分类的效率。 展开更多
关键词 文本特征 聚类加权 最小二乘支持向量机 布谷鸟搜索算法
下载PDF
KNN-FCM聚类算法在中文搜索引擎文本过滤中的应用 被引量:2
17
作者 张俊丽 张帆 《图书与情报》 CSSCI 2007年第4期48-51,62,共5页
目前,大多数搜索引擎都是用相关度或page-rank或HITS(Hyperlink-Induced Topic Search)算法对匹配的结果进行排序,然后以列表的方式呈现给用户。事实表明:其索引质量不高,对所收集的信息缺乏有效的分类处理,用户面对成千上万的搜索结果... 目前,大多数搜索引擎都是用相关度或page-rank或HITS(Hyperlink-Induced Topic Search)算法对匹配的结果进行排序,然后以列表的方式呈现给用户。事实表明:其索引质量不高,对所收集的信息缺乏有效的分类处理,用户面对成千上万的搜索结果无法一一查看,而真正符合需要的搜索结果常常因为排在后面而被漏检,返回的结果只有极少部分得到了用户的有效利用。文章提出运用基于K近邻的模糊C均值算法(以下简称KNN-FCM)对搜索引擎的初始结果进行自动聚类,系统再针对用户作出的适时反馈进行相应的输出调整,从而方便用户查找信息。 展开更多
关键词 搜索引擎 KNN 模糊C均值 文本过滤
下载PDF
MS-DOC文件文本提取研究 被引量:1
18
作者 黄步根 伏娟 《计算机工程与科学》 CSCD 北大核心 2014年第8期1505-1511,共7页
关键词搜索广泛应用于情报分析、搜索引擎和计算机取证,对MS-DOC文件进行关键词搜索可能漏判,明明存在的关键词却找不到。微软复合文档结构由一系列流组成,流以扇区为单位存储,通过目录结构和扇区分配表对流及其存储空间进行管理。MS-DO... 关键词搜索广泛应用于情报分析、搜索引擎和计算机取证,对MS-DOC文件进行关键词搜索可能漏判,明明存在的关键词却找不到。微软复合文档结构由一系列流组成,流以扇区为单位存储,通过目录结构和扇区分配表对流及其存储空间进行管理。MS-DOC文件中的文本存储在WordDocument流中,文本存储不一定连续,通过Table流记录分块情况。关键词可能跨越不相邻扇区,即使在相邻扇区,一个关键词可能一部分是压缩存储,另一部分是非压缩存储,这些都是关键词搜索漏判的原因。根据Table流中的分块信息提取WordDocument流中的文本,并统一编码格式,进而进行关键词搜索,就可以避免漏判。 展开更多
关键词 复合文档 文本提取 关键词 搜索 计算机取证
下载PDF
基于Lucene的MYSearch全文搜索引擎
19
作者 刘亚姝 黄岳 《微型机与应用》 2010年第18期86-88,共3页
基于Lucene开源框架设计实现了MYSearch全文搜索引擎。给出了MYSearch实现的基本原理和设计流程,以及实验结果,并针对Lucene在中文分词方面的不足展开了讨论,给出了改进方法。
关键词 全文搜索引擎 Lucence 分词 索引
下载PDF
基于大数据技术的高职院校全量数据资源池的建设与实践
20
作者 靳晓娟 《信息与电脑》 2024年第3期232-234,共3页
各高职院校智慧校园建设均取得了一定成就,积累了大量的数据。在此背景下,全量数据资源池的建设得到高职院校的关注。文章对现阶段数据建设方面的问题进行分析,并探讨全量数据资源池建设的重点任务、建设思路及应用价值,为高职院校决策... 各高职院校智慧校园建设均取得了一定成就,积累了大量的数据。在此背景下,全量数据资源池的建设得到高职院校的关注。文章对现阶段数据建设方面的问题进行分析,并探讨全量数据资源池建设的重点任务、建设思路及应用价值,为高职院校决策分析、教学科研、管理服务提供全维度、高质量的数据引擎,推动高职院校高质量发展。 展开更多
关键词 高职院校 全量数据资源池 全域数据采集 全文搜索引擎
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部