期刊文献+
共找到1,053篇文章
< 1 2 53 >
每页显示 20 50 100
A Full Text Retrieval System in a Digital Library Environment 被引量:1
1
作者 Kehinde Daniel Aruleba Dipo Theophilus Akomolafe Babajide Afeni 《Intelligent Information Management》 2016年第1期1-8,共8页
The volume of information being created, generated and stored is huge. Without adequate knowledge of Information Retrieval (IR) methods, the retrieval process for information would be cumbersome and frustrating. Studi... The volume of information being created, generated and stored is huge. Without adequate knowledge of Information Retrieval (IR) methods, the retrieval process for information would be cumbersome and frustrating. Studies have further revealed that IR methods are essential in information centres (for example, Digital Library environment) for storage and retrieval of information. Therefore, with more than one billion people accessing the Internet, and millions of queries being issued on a daily basis, modern Web search engines are facing a problem of daunting scale. The main problem associated with the existing search engines is how to avoid irrelevant information retrieval and to retrieve the relevant ones. In this study, the existing system of library retrieval was studied. Problems associated with them were analyzed in order to address this problem. The concept of existing information retrieval models was studied, and the knowledge gained was used to design a digital library information retrieval system. It was successfully implemented using a real life data. The need for a continuous evaluation of the IR methods for effective and efficient full text retrieval system was recommended. 展开更多
关键词 full text Information Retrieval LIBRARY Digital Library QUERIES INDEXING CATALOGUE
下载PDF
Full Text Ejournal Packages East and West:CJN and JSTOR
2
作者 Anthony W.Ferguson Angela Ko 《现代图书情报技术》 CSSCI 北大核心 2002年第S1期124-128,共5页
In libraries,full text ejournal packages are among themost unique aspects of the digital revolution.They challengemany of the basic concepts that librarians have held close totheir hearts:The journals themselves come ... In libraries,full text ejournal packages are among themost unique aspects of the digital revolution.They challengemany of the basic concepts that librarians have held close totheir hearts:The journals themselves come in packages-thatis,unlike their print counter parts,they are bought as apackage and not one at a time.Many librarians who havelooked with pride at their journal collections because theywere selected one-by-one,on the basis of local needs, 展开更多
关键词 full text Ejournal Packages East and West CJN
下载PDF
Methods for Administration of Family Planning Technical Services(Full text)
3
《China Population Today》 2001年第Z2期2-6,共5页
关键词 full text Methods for Administration of Family Planning Technical Services
下载PDF
Application of Full Text Search Engine Based on Lucene
4
作者 Rujia Gao Danying Li +1 位作者 Wanlong Li Yaze Dong 《Advances in Internet of Things》 2012年第4期106-109,共4页
This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retri... This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retrieval’s response time, the experimental results show that the full text search of Lucene has faster retrieval speed. 展开更多
关键词 full text SEARCH ENGINE System ARCHITECTURE LUCENE
下载PDF
Journal of Genetics and Genomics——Full Text Online Access
5
《Journal of Genetics and Genomics》 SCIE CAS CSCD 2015年第11期I0001-I0001,共1页
Disclaimer No responsibility is assumed by the Sponsors, Publishers and Editors for errors or any consequences arising from the use of information contained in the Journal; the views and opinions expressed do not refl... Disclaimer No responsibility is assumed by the Sponsors, Publishers and Editors for errors or any consequences arising from the use of information contained in the Journal; the views and opinions expressed do not reflect those of the Sponsors, Publishers and Editors, neither does the publication of advertisements constitute any endorsement of the products advertised by the Sponsors, Publishers and Editors. 展开更多
关键词 text Journal of Genetics and Genomics full text Online Access
原文传递
Identifying Scientific Project-generated Data Citation from Full-text Articles: An Investigation of TCGA Data Citation 被引量:4
6
作者 Jiao Li Si Zheng +2 位作者 Hongyu Kang Zhen Hou Qing Qian 《Journal of Data and Information Science》 2016年第2期32-44,共13页
Purpose: In the open science era, it is typical to share project-generated scientific data by depositing it in an open and accessible database. Moreover, scientific publications are preserved in a digital library arc... Purpose: In the open science era, it is typical to share project-generated scientific data by depositing it in an open and accessible database. Moreover, scientific publications are preserved in a digital library archive. It is challenging to identify the data usage that is mentioned in literature and associate it with its source. Here, we investigated the data usage of a government-funded cancer genomics project, The Cancer Genome Atlas(TCGA), via a full-text literature analysis.Design/methodology/approach: We focused on identifying articles using the TCGA dataset and constructing linkages between the articles and the specific TCGA dataset. First, we collected 5,372 TCGA-related articles from Pub Med Central(PMC). Second, we constructed a benchmark set with 25 full-text articles that truly used the TCGA data in their studies, and we summarized the key features of the benchmark set. Third, the key features were applied to the remaining PMC full-text articles that were collected from PMC.Findings: The amount of publications that use TCGA data has increased significantly since 2011, although the TCGA project was launched in 2005. Additionally, we found that the critical areas of focus in the studies that use the TCGA data were glioblastoma multiforme, lung cancer, and breast cancer; meanwhile, data from the RNA-sequencing(RNA-seq) platform is the most preferable for use.Research limitations: The current workflow to identify articles that truly used TCGA data is labor-intensive. An automatic method is expected to improve the performance.Practical implications: This study will help cancer genomics researchers determine the latest advancements in cancer molecular therapy, and it will promote data sharing and data-intensive scientific discovery.Originality/value: Few studies have been conducted to investigate data usage by governmentfunded projects/programs since their launch. In this preliminary study, we extracted articles that use TCGA data from PMC, and we created a link between the full-text articles and the source data. 展开更多
关键词 Scientific data full-text literature Open access PubMed Central Data citation
下载PDF
Influences of digital resource acquisition on scientific research behaviors——The statistical analysis on the full-text downloading quantity and cited times
7
作者 LIU Xiaomin ZHANG Jianyong 《Chinese Journal of Library and Information Science》 2009年第4期71-78,共8页
With the emergence and further development of the digital library, the approaches of information acquisition correspondingly change a lot. This paper makes a statistical analysis on the journal downloading and citatio... With the emergence and further development of the digital library, the approaches of information acquisition correspondingly change a lot. This paper makes a statistical analysis on the journal downloading and citation behaviors under the digital environment conceived by the National Science Library(NSL), Chinese Academy of Sciences(CAS). It can be seen that the development of digital resources has influenced scientific research behaviors. For example, the large quantity of full-text downloading will maintain; the trend of journal downloading behaviors is basically same as the journal citation behavior; journals with large quantity of full-text downloading also boast the high cited times, and vice versa. Furthermore, authors make a linear regression analysis, with the journal downloading amount as the independent variable and journal cited times as dependent variable. Then they also prove the positive correlation between the journal downloading and citation behaviors by means of Pearson's correlation coefficient formula. 展开更多
关键词 full-text downloading Journal citation Correlation Cited times
下载PDF
企业级全文搜索系统设计与实现
8
作者 王盛义 刘顺章 《信息技术与标准化》 2024年第7期105-109,共5页
为解决企业内部信息资源难以被快速精确检索和有效利用、全文检索时数据访问权限控制问题,提出一种全文搜索系统数据访问权限控制模型,并设计了企业级全文搜索系统,阐述了企业级全文搜索系统的架构及其数据同步模块、数据索引模块、数... 为解决企业内部信息资源难以被快速精确检索和有效利用、全文检索时数据访问权限控制问题,提出一种全文搜索系统数据访问权限控制模型,并设计了企业级全文搜索系统,阐述了企业级全文搜索系统的架构及其数据同步模块、数据索引模块、数据搜索模块、权限控制模块等重要模块的设计与实现。该系统能在用户权限范围内对数据进行全文检索,有效实现对企业信息资源进行统一整合和检索,提高企业信息资源利用效率。 展开更多
关键词 Elasticsearch 全文搜索 分词检索 访问控制 企业搜索
下载PDF
基于实时同步和全文搜索技术的方剂学多维实训平台 被引量:1
9
作者 魏培阳 史晓雨 +3 位作者 周杰三 邢晓方 梁佳豪 刘洋 《现代电子技术》 北大核心 2024年第2期67-73,共7页
针对中医方剂学存在的数据量大、类型多样、学习识记困难等问题,提出一种改进的基于实时同步和全文搜索算法的方剂学多维实训平台(MTPF)。分析MTPF系统需求并搭建基础框架,采用Canal同步数据和ElasticSearch提供全文搜索服务,以保证业... 针对中医方剂学存在的数据量大、类型多样、学习识记困难等问题,提出一种改进的基于实时同步和全文搜索算法的方剂学多维实训平台(MTPF)。分析MTPF系统需求并搭建基础框架,采用Canal同步数据和ElasticSearch提供全文搜索服务,以保证业务应用的效率和性能;结合MTPF业务领域问题,提出针对具体业务的可配置和过滤的同步算法,构建面向搜索的自定义分词词典优化算法。通过系统应用及对比实验,验证了改进算法能够满足MTPF的需求;通过与其他框架的对比实验,证明了改进算法在同步时延、资源消耗、搜索速度等方面均取得了良好的效果,保障了业务数据信息在传输、存储、同步、搜索等环节的性能。 展开更多
关键词 方剂学多维实训平台 实时同步 全文搜索 ElasticSearch CANAL REDIS MySQL
下载PDF
大模型时代下全文计量分析的应用与思考——2023全文本文献计量分析学术沙龙综述
10
作者 周海晨 章成志 +3 位作者 胡志刚 徐硕 毛进 陈亮 《信息资源管理学报》 CSSCI 2024年第2期162-168,F0003,共8页
2023年9月14日—16日,由中国科学院成都文献情报中心主办、科技创新评价研究中心(SERC)承办的“第六届科学计量与科技评价天府论坛”在成都举办。由章成志、胡志刚、徐硕等人共同发起的第四届“全文本文献计量分析”沙龙作为其中的一项... 2023年9月14日—16日,由中国科学院成都文献情报中心主办、科技创新评价研究中心(SERC)承办的“第六届科学计量与科技评价天府论坛”在成都举办。由章成志、胡志刚、徐硕等人共同发起的第四届“全文本文献计量分析”沙龙作为其中的一项重要活动,吸引了八十余位专家学者的积极参与和深入交流。本文通过对沙龙嘉宾的发言与研讨内容进行梳理与总结,将沙龙的主要内容归纳为大语言模型与全文本计量分析、全文计量分析的应用场景等方面,以期介绍国内外全文本文献计量分析的研究现状和发展趋势。 展开更多
关键词 全文本计量 大语言模型 颠覆性技术 创新识别
下载PDF
基于ElasticSearch的医疗数据检索系统的设计与实现
11
作者 汪睿 胡外光 +1 位作者 胡珊珊 周颖 《信息技术》 2024年第4期76-82,共7页
随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearc... 随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearch的医疗数据检索系统。该系统将医疗数据进行标准化,填补缺失值,选取合适的分词算法进行分词,将处理后的数据存入ElasticSearch中,同时使用SpringBoot构建系统应用,消耗多个医疗基础业务系统产生的数据,最终形成统一的医疗数据检索系统,给用户提供便捷、精确的查询服务。 展开更多
关键词 lasticSearch 医疗数据 文本分词 全文检索 分布式搜索
下载PDF
全文本视角下的核心引文测度:概念界定、指标体系与识别模型
12
作者 林歌歌 侯海燕 +2 位作者 潘宇馨 梁国强 胡志刚 《情报学报》 CSSCI CSCD 北大核心 2024年第10期1199-1212,共14页
识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录... 识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录信息和引用信息2个维度、8个子维度及33个引文特征指标的核心引文识别指标体系。其次,通过多种机器学习模型(如随机森林、支持向量机、逻辑回归)对引文特征指标进行遴选与优化,分析其相关性及信息增益,保留21个重要的引文特征指标,并验证识别模型的有效性。研究结果表明,基于引用信息的引文特征指标在识别核心引文时具有更高的重要性和贡献度。机器学习模型在核心引文识别中的表现优异,特别是随机森林、支持向量机、逻辑回归等模型,其ROC (receiver operating characteristic)曲线的AUC (area under curve)值均大于0.85,证明了模型的高效性和鲁棒性。核心引文测度方法及识别模型不仅为科学评价体系提供了更精准的工具,也为深入研究引文分析奠定了坚实的基础。 展开更多
关键词 核心引文 引用信息 题录信息 机器学习 全文引文分析
下载PDF
Oracle Text技术在复杂结构数据库中的应用 被引量:5
13
作者 蒙辉 陈燕 《计算机技术与发展》 2007年第4期38-40,44,共4页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。 展开更多
关键词 ORACLE text 复杂结构数据库 全文检索
下载PDF
一种新型高效全文检索引擎的设计
14
作者 董宗然 闻柏智 朱毅 《软件工程》 2024年第2期44-48,共5页
为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中... 为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中主键形成的映射查询数据,然后通过相关度算法对这些数据进行排序,并以字典树作为搜索提示,实现高效的全文检索。实验结果表明:与ElasticSearch使用相同词集时,随着测试数据量的变化,所设计的全文检索引擎的查询效率是ElasticSearch效率的80~1200倍,其效率优势随着数据量增加呈现反比例关系变化,并且在17919条文档数据下,其内存占用不超过2.5 GB,适合用于海量文档数据检索。 展开更多
关键词 倒排索引 全文检索 检索引擎 模糊查询 字典树
下载PDF
面向学术全文本多维知识元的学术图谱构建研究
15
作者 沈思 朱雨菲 《情报学报》 CSSCI CSCD 北大核心 2024年第8期960-975,共16页
学术全文本中包含了多种知识元,对这些知识元进行挖掘与组织,可以有效提升学术资源的利用效率。通过学术知识图谱的构建,将论文中各类隐性“知识元”串联起来,不但可以节省研究者获取知识点的时间,还可以通过知识图谱内的网络社区进行... 学术全文本中包含了多种知识元,对这些知识元进行挖掘与组织,可以有效提升学术资源的利用效率。通过学术知识图谱的构建,将论文中各类隐性“知识元”串联起来,不但可以节省研究者获取知识点的时间,还可以通过知识图谱内的网络社区进行知识点的扩充。通过系统而全面的文献调研,本文从宏观、中观和微观3个维度出发,确定了18种学术论文中的关键知识元,并将学术全文本中的描述信息作为知识元对象,设计出学术知识图谱概念框架。然后,选取Journal of the Association for Information Science and Technology(JASIST)期刊的515篇学术全文本,对每篇论文中的关键知识元进行人工标注与基于深度学习的知识元抽取研究。研究内容包括该类知识元在人工标注过程中是否会遇到问题、在自动抽取时是否会达到预期值,从而对参与图谱构建的知识元进行筛选。最终筛选出9种知识元,包括数学公式、软件工具、数据源、具体模型、表、图、研究展望、研究问题和研究结果,与题录数据中的知识元共同生成由头知识元、关系、尾知识元组成的三元组,存入图数据库。最后,对该图谱进行可视化的评估与知识元检索研究,证明了其可行性与可扩展性。研究结果表明,学术全文本中的部分知识元适合大规模的自动化标注,而且各类知识元可以通过互相链接形成密集的知识社区,并具备知识元搜索等功能。 展开更多
关键词 知识元 知识图谱 学术全文本 深度学习
下载PDF
基于大语言模型的新质生产力内涵特征挖掘研究
16
作者 余云龙 白冰 +2 位作者 陈仕吉 邱均平 丁敬达 《现代情报》 CSSCI 北大核心 2024年第11期16-26,共11页
[目的/意义]揭示新质生产力的内涵特征与结构,深刻理解新质生产力的内涵要义。[方法/过程]首先,依据习近平总书记有关新质生产力的重要讲话和论述,凝练新质生产力核心内涵;其次,运用百度文心一言大语言模型ERNIE-bot 4.0对新质生产力相... [目的/意义]揭示新质生产力的内涵特征与结构,深刻理解新质生产力的内涵要义。[方法/过程]首先,依据习近平总书记有关新质生产力的重要讲话和论述,凝练新质生产力核心内涵;其次,运用百度文心一言大语言模型ERNIE-bot 4.0对新质生产力相关论文进行关键词提取;第三,运用随机块模型对关键词共现矩阵的结构对等性进行分析,并运用知识图谱技术对关键词共现网络和组合网络进行可视化分析,揭示新质生产力内涵特征的研究重点;最后,探讨新质生产力核心内涵的层次结构。[结果/结论]新质生产力相关研究紧紧围绕习近平新质生产力理论的核心内涵展开。文献全文本关键词共现网络存在核心—边缘结构,处于核心位置的关键词为学术界重点关注的新质生产力内涵特征。科技创新和高质量发展占据共词网络的核心位置,是新质生产力的首要内涵,是学术界研究的核心。数字技术、数据要素、战略性新兴产业、未来产业、人才培养和绿色发展等关键词位于共词网络的次核心位置。结合词频和组合关系网络分析结果可知,数字技术和数据要素是新质生产力重要内涵,是学术界研究的焦点;战略性新兴产业和未来产业代表新质生产力主要内涵,是学术界研究的重点内容;人才资源和绿色发展是新质生产力核心内涵的重要外延,是学术界研究的主要内容。此外,新质生产力的研究内容非常广泛,比如处于边缘位置的治理体系、对外开放等代表新质生产力高质量发展的顶层设计需求。 展开更多
关键词 高水平创新 数智技术 人才体系 低碳发展 全文本分析
下载PDF
基于Oracle Text电子政务全文检索技术的应用 被引量:5
17
作者 陈天伟 《办公自动化》 2007年第2期11-13,共3页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle的一个组件,提供了强大的全文检索功能,用Oracle做后台数据库,就可以充分利用其全文检索技术,构建复杂的大型文档管理系统。本文主要介绍了Oracle Text的体系结构及其... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle的一个组件,提供了强大的全文检索功能,用Oracle做后台数据库,就可以充分利用其全文检索技术,构建复杂的大型文档管理系统。本文主要介绍了Oracle Text的体系结构及其在电子政务系统中的应用与实现,讨论了采用Oracle Text为组件进行电子政务全文检索应用系统的设计思想,并着重讨论了Oracle Text体系架构,在Oracle Text上如何实现全文检索做了某些研究,结合电子政务典型业务流程实例进行了具体实践的描述,对以后电子政务全文检索开发设计有一定的现实意义。 展开更多
关键词 全文检索 电子政务 ORACLE text 信息资源库
下载PDF
铁路货运营销大数据系统的设计与实现
18
作者 王娜娜 张建国 《铁路计算机应用》 2024年第5期36-39,共4页
为实现货运营销各项业务的有机融合,优化铁路货运营销模式,设计了铁路货运营销大数据系统,阐述了系统的总体架构,通过数据采集调度技术和基于机器学习的预测分析技术实现客户关系管理、一体化考核管理、分析决策管理和市场监测等功能。... 为实现货运营销各项业务的有机融合,优化铁路货运营销模式,设计了铁路货运营销大数据系统,阐述了系统的总体架构,通过数据采集调度技术和基于机器学习的预测分析技术实现客户关系管理、一体化考核管理、分析决策管理和市场监测等功能。该系统已在中国铁路济南局集团有限公司上线应用,实现了经济效益的显著提升,有效提升货运生产组织水平,为货运部门的各项营销决策提供技术支持。 展开更多
关键词 货运营销 大数据 全文检索 预测分析 客户关系
下载PDF
基于ElasticSearch的输变电工程全文检索研究
19
作者 张建广 徐鲲 +3 位作者 董鉥涛 刘迪 王向上 李春林 《黑龙江科学》 2024年第16期94-97,共4页
随着输变电工程建设工作的开展,多源异构的全过程非结构化文档体量日益增大,需要对这些非结构化文档进行稳定管理。为实现输变电工程非结构化文档的高效检索,研究了基于ElasticSearch的输变电工程全文检索方案,构建电网专用术语词典对... 随着输变电工程建设工作的开展,多源异构的全过程非结构化文档体量日益增大,需要对这些非结构化文档进行稳定管理。为实现输变电工程非结构化文档的高效检索,研究了基于ElasticSearch的输变电工程全文检索方案,构建电网专用术语词典对智能化分词进行辅助优化,融合输变电工程资料的特征信息,对分词成果进行语义赋值,基于语义标签改进分词算法,进一步提升全文检索效率和准确率,搭建了输变电工程全文检索系统,以验证此技术方案的可行性。 展开更多
关键词 输变电工程 全文检索 ElasticSearch 中文分词 语义检索
下载PDF
全文检索技术在图书检索中的应用
20
作者 高霞 《中原工学院学报》 CAS 2024年第2期85-89,共5页
现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的... 现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的所有词组和关键词进行索引,支持快速检索到文本中任何一个单词和关键词。若将全文检索技术应用于图书检索中,可使用户根据任意关键词检索图书,可根据检索量和用户习惯推荐热门图书。文章介绍了如何在图书检索过程中应用全文检索技术,分析了全文检索引擎选择、图书文本解析、图书文本分词、图书索引设计、图书文档提交等主要过程,并给出了全文检索技术的最终实现效果,以期对提升图书检索系统的易用性提供一定借鉴。 展开更多
关键词 图书检索系统 全文检索 分词器 索引结构 推荐算法 检索命中率
下载PDF
上一页 1 2 53 下一页 到第
使用帮助 返回顶部