期刊文献+
共找到490篇文章
< 1 2 25 >
每页显示 20 50 100
Bilingual Dictionary Approach for Malay-English Cross-Language Information Retrieval
1
作者 Nurjannaton Hidayah Rais Muhamad Taufik Abdullah Rabiah Abdul Kadir 《通讯和计算机(中英文版)》 2011年第5期354-360,共7页
关键词 跨语言信息检索 双语词典 英语 查询转换 语言翻译 翻译方法 语言表达 自动翻译
下载PDF
Query Expansion Using Wikipedia and a Concept Base in Cross-language Information Retrieval
2
作者 Pham Huy Anh Yukawa Takashi 《Computer Technology and Application》 2013年第10期522-531,共10页
关键词 跨语言信息检索 查询扩展 机器翻译系统 信息检索系统 语言翻译 专有名词 在线词典 科学文献
下载PDF
Cross-Language Information Extraction and Auto Evaluation for OOV Term Translations
3
作者 Jian Qu Le Minh Nguyen Akira Shimazu 《China Communications》 SCIE CSCD 2016年第12期277-296,共20页
OOV term translation plays an important role in natural language processing. Although many researchers in the past have endeavored to solve the OOV term translation problems, but none existing methods offer definition... OOV term translation plays an important role in natural language processing. Although many researchers in the past have endeavored to solve the OOV term translation problems, but none existing methods offer definition or context information of OOV terms. Furthermore, non-existing methods focus on cross-language definition retrieval for OOV terms. Never the less, it has always been so difficult to evaluate the correctness of an OOV term translation without domain specific knowledge and correct references. Our English definition ranking method differentiate the types of OOV terms, and applies different methods for translation extraction. Our English definition ranking method also extracts multilingual context information and monolingual definitions of OOV terms. In addition, we propose a novel cross-language definition retrieval system for OOV terms. Never the less, we propose an auto re-evaluation method to evaluate the correctness of OOV translations and definitions. Our methods achieve high performances against existing methods. 展开更多
关键词 Term translation multilingual information retrieval definition extraction cross-lingual definition extraction auto re-evaluation
下载PDF
Research on Cross-Language Retrieval Using Bilingual Word Vectors in Different Languages
4
作者 Yulong Li Dong Zhou 《国际计算机前沿大会会议论文集》 2019年第1期462-465,共4页
Bilingual word vectors have been exploited a lot in cross-language information retrieval research. However, most of the research is currently focused on similar language pairs. There are very few studies exploring the... Bilingual word vectors have been exploited a lot in cross-language information retrieval research. However, most of the research is currently focused on similar language pairs. There are very few studies exploring the impact of using bilingual word vectors for cross-language information retrieval in long-distance language pairs. In this paper, it systematically analyzes the retrieval performance of various European languages (English, German, Italian, French, Finnish, Dutch) as well as Asian languages (Chinese, Japanese) in the adhoc task of CLEF 2002–2003 campaign. Genetic proximity was used to visually represent the relationships between languages and compare their crosslingual retrieval performance in various settings. The results show that the differences in language vocabulary would dramatically affect the retrieval performance. At the same time, the term by term translation retrieval method performs slightly better than the simple vector addition retrieval methods. It proves that the translation-based retrieval model can still maintain its advantage under the new semantic scheme. 展开更多
关键词 cross-language information retrieval BILINGUAL word EMBEDDING Genetic PROXIMITY language PAIRS
下载PDF
A new approach to query expansion in information retrieval 被引量:2
5
作者 李卫疆 Zhao +2 位作者 Tiejun Wang Xian'gang 《High Technology Letters》 EI CAS 2008年第1期77-80,共4页
To eliminate the mismatch between words of relevant documents and user's query and more seriousnegative effects it has on the performance of information retrieval,a method of query expansion on the ba-sis of new t... To eliminate the mismatch between words of relevant documents and user's query and more seriousnegative effects it has on the performance of information retrieval,a method of query expansion on the ba-sis of new terms co-occurrence representation was put forward by analyzing the process of producingquery.The expansion terms were selected according to their correlation to the whole query.At the sametime,the position information between terms were considered.The experimental result on test retrievalconference(TREC)data collection shows that the method proposed in the paper has made an improve-ment of 5%~19% all the time than the language modeling method without expansion.Compared to thepopular approach of query expansion,pseudo feedback,the precision of the proposed method is competi-tive. 展开更多
关键词 信息检索 语言模型 查询技术 计算机技术
下载PDF
New Retrieval Method Based on Relative Entropy for LanguageModeling with Different Smoothing Methods
6
作者 霍华 刘俊强 冯博琴 《Journal of Southwest Jiaotong University(English Edition)》 2006年第2期113-120,共8页
A language model for information retrieval is built by using a query language model to generate queries and a document language model to generate documents. The documents are ranked according to the relative entropies... A language model for information retrieval is built by using a query language model to generate queries and a document language model to generate documents. The documents are ranked according to the relative entropies of estimated document language models with respect to the estimated query language model. Two popular and relatively efficient smoothing methods, the Jelinek- Mercer method and the absolute discounting method, are used to smooth the document language model in estimation of the document language, A combined model composed of the feedback document language model and the collection language model is used to estimate the query model. A performacne comparison between the new retrieval method and the existing method with feedback is made, and the retrieval performances of the proposed method with the two different smoothing techniques are evaluated on three Text Retrieval Conference (TREC) data sets. Experimental results show that the method is effective and performs better than the basic language modeling approach; moreover, the method using the Jelinek-Mercer technique performs better than that using the absolute discounting technique, and the perfomance is sensitive to the smoothing peramters. 展开更多
关键词 information retrieval Relative entropy language modeling SMOOTHING
下载PDF
Natural Language Processing with Optimal Deep Learning-Enabled Intelligent Image Captioning System
7
作者 Radwa Marzouk Eatedal Alabdulkreem +5 位作者 Mohamed KNour Mesfer Al Duhayyim Mahmoud Othman Abu Sarwar Zamani Ishfaq Yaseen Abdelwahed Motwakel 《Computers, Materials & Continua》 SCIE EI 2023年第2期4435-4451,共17页
The recent developments in Multimedia Internet of Things(MIoT)devices,empowered with Natural Language Processing(NLP)model,seem to be a promising future of smart devices.It plays an important role in industrial models... The recent developments in Multimedia Internet of Things(MIoT)devices,empowered with Natural Language Processing(NLP)model,seem to be a promising future of smart devices.It plays an important role in industrial models such as speech understanding,emotion detection,home automation,and so on.If an image needs to be captioned,then the objects in that image,its actions and connections,and any silent feature that remains under-projected or missing from the images should be identified.The aim of the image captioning process is to generate a caption for image.In next step,the image should be provided with one of the most significant and detailed descriptions that is syntactically as well as semantically correct.In this scenario,computer vision model is used to identify the objects and NLP approaches are followed to describe the image.The current study develops aNatural Language Processing with Optimal Deep Learning Enabled Intelligent Image Captioning System(NLPODL-IICS).The aim of the presented NLPODL-IICS model is to produce a proper description for input image.To attain this,the proposed NLPODL-IICS follows two stages such as encoding and decoding processes.Initially,at the encoding side,the proposed NLPODL-IICS model makes use of Hunger Games Search(HGS)with Neural Search Architecture Network(NASNet)model.This model represents the input data appropriately by inserting it into a predefined length vector.Besides,during decoding phase,Chimp Optimization Algorithm(COA)with deeper Long Short Term Memory(LSTM)approach is followed to concatenate the description sentences 4436 CMC,2023,vol.74,no.2 produced by the method.The application of HGS and COA algorithms helps in accomplishing proper parameter tuning for NASNet and LSTM models respectively.The proposed NLPODL-IICS model was experimentally validated with the help of two benchmark datasets.Awidespread comparative analysis confirmed the superior performance of NLPODL-IICS model over other models. 展开更多
关键词 Natural language processing information retrieval image captioning deep learning metaheuristics
下载PDF
Chinese-based research on subject-covered information retrieval supervised by textual semantic domain
8
作者 DU Jia-li LIU Yuan-yuan YU Ping-fang 《通讯和计算机(中英文版)》 2009年第7期68-78,共11页
关键词 NLP 语义结合 通信 SE
下载PDF
基于类型矩阵转移的汉越事件因果关系识别
9
作者 高盛祥 熊琨 +2 位作者 余正涛 张磊 黄于欣 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第1期118-127,共10页
针对汉越跨语言新闻事件因果关系识别中,汉越跨语言的文本语义空间难以统一、新闻之间的因果关联特征捕获困难的问题,提出了基于类型矩阵转移的汉越跨语言新闻事件因果关系识别方法。通过跨语言预训练统一汉越跨语言的文本语义空间,使... 针对汉越跨语言新闻事件因果关系识别中,汉越跨语言的文本语义空间难以统一、新闻之间的因果关联特征捕获困难的问题,提出了基于类型矩阵转移的汉越跨语言新闻事件因果关系识别方法。通过跨语言预训练统一汉越跨语言的文本语义空间,使用树形长短期记忆循环神经网络提取汉越文本中的句法结构化特征,融入汉越句法特征并结合基于事件类型转移的注意力机制,对汉越事件句对的因果关系进行识别。实验结果表明,该方法在汉越跨语言新闻事件因果关系的识别上较基线模型准确率有所提升。 展开更多
关键词 汉越跨语言 事件类型 语言对抗 句法信息 因果关系
下载PDF
特征融合的装修案例跨模态检索方法
10
作者 亢洁 刘威 《智能系统学报》 CSCD 北大核心 2024年第2期429-437,共9页
目前家装客服系统中主要依靠人工方式进行装修案例检索,导致该系统不能满足用户对咨询服务快捷、及时的需求而且人力成本高,故提出一种基于特征融合的装修案例跨模态检索算法。针对多模态数据的语义信息挖掘不充分,模型检索精度低等问题... 目前家装客服系统中主要依靠人工方式进行装修案例检索,导致该系统不能满足用户对咨询服务快捷、及时的需求而且人力成本高,故提出一种基于特征融合的装修案例跨模态检索算法。针对多模态数据的语义信息挖掘不充分,模型检索精度低等问题,对现有的风格聚合模块进行改进,在原始模块中引入通道注意力机制,以此来为每组装修案例中不同图片的特征向量添加合适的权重,从而增强包含更多有用信息的重要特征并削弱其他不重要的特征。同时,为充分利用多模态信息,设计一种适用于检索场景下的多模态特征融合模块,该模块能够自适应地控制2种不同模态的特征向量进行一系列的融合操作,以实现跨模态数据间的知识流动与共享,从而生成语义更丰富、表达能力更强的特征向量,进一步提升模型的检索性能。在自建的装修案例多模态数据集上将该方法与其他方法进行比较,试验结果表明本文方法在装修案例检索上具有更优越的性能。 展开更多
关键词 家装客服系统 装修案例检索 跨模态检索 风格聚合 多模态 特征融合 通道注意力机制 语义信息
下载PDF
面向汉越跨语言事件检索的事件预训练方法
11
作者 吴少扬 余正涛 +3 位作者 黄于欣 朱恩昌 高盛祥 邓同杰 《中文信息学报》 CSCD 北大核心 2024年第4期78-85,共8页
汉越跨语言事件检索是用汉语查询检索越南语事件新闻的任务。由于越南语属于典型的低资源语言,汉越跨语言事件检索缺乏大规模的标注数据,并且现有的跨语言预训练模型无法很好地表征文本中丰富的汉越对齐事件知识,不适用于该任务。因此,... 汉越跨语言事件检索是用汉语查询检索越南语事件新闻的任务。由于越南语属于典型的低资源语言,汉越跨语言事件检索缺乏大规模的标注数据,并且现有的跨语言预训练模型无法很好地表征文本中丰富的汉越对齐事件知识,不适用于该任务。因此,为了将汉越双语对齐的事件知识融入到多语言预训练语言模型中,该文提出了两个预训练方法,即事件要素掩码预训练以及跨语言事件对比预训练。在该文构造的汉越跨语言事件检索数据集和公开跨语言问答数据集上进行了实验,比基线提升1%~3%MAP值,2%~4%NDCG值,证明了该文方法的有效性。 展开更多
关键词 事件预训练 跨语言事件检索 掩码语言模型 对比学习
下载PDF
基于布局化-语义联合表征遥感图文检索方法
12
作者 张若愚 聂婕 +2 位作者 宋宁 郑程予 魏志强 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期671-683,共13页
遥感图文检索可以从类别繁多、内容复杂的遥感数据中检索到有价值的信息,对环境评估、城市规划以及灾害预测具有重要意义。但是,遥感图文跨模态检索存在一个关键问题,即遥感图像的空间布局信息被忽略。其主要体现在2个方面:①遥感目标... 遥感图文检索可以从类别繁多、内容复杂的遥感数据中检索到有价值的信息,对环境评估、城市规划以及灾害预测具有重要意义。但是,遥感图文跨模态检索存在一个关键问题,即遥感图像的空间布局信息被忽略。其主要体现在2个方面:①遥感目标的远距离建模困难;②遥感相邻次要目标被淹没。基于以上问题,提出了一种基于布局化-语义联合表征的跨模态遥感图像文本检索(SL-SJR),主要包括主导语义监督的布局化视觉特征提取(DSSL)模块、布局化视觉-全局语义交叉指导(LV-GSCG)模块和多视角匹配(MVM)模块。DSSL模块实现主导语义类别特征监督下图像的布局化建模。LV-GSCG模块计算布局化视觉特征与文本中提取的全局语义特征的相似度来实现不同模态特征的交互。MVM模块建立跨模态特征指导的多视角度量匹配机制以消除跨模态数据之间的语义鸿沟。在4个基线遥感图像文本数据集上的实验验证,结果表明所提方法在大多数跨模态遥感图像文本检索任务中可以达到最先进的性能。 展开更多
关键词 遥感图像 跨模态检索 空间布局信息 主导语义监督 类监督机制
下载PDF
基于提示学习的轻量化代码生成方法
13
作者 徐一然 周宇 《计算机科学》 CSCD 北大核心 2024年第6期61-67,共7页
代码自动生成是提高软件开发效率的有效途径之一,已有的研究一般将代码生成作为一项序列到序列的任务,并且大规模预训练语言模型的微调过程往往伴随着高昂的算力开销。文中提出了一种基于提示学习的轻量化代码生成方法(Prompt Learning ... 代码自动生成是提高软件开发效率的有效途径之一,已有的研究一般将代码生成作为一项序列到序列的任务,并且大规模预训练语言模型的微调过程往往伴随着高昂的算力开销。文中提出了一种基于提示学习的轻量化代码生成方法(Prompt Learning based Parameter-Efficient Code Generation,PPECG),该方法通过查询代码语料库中与当前需求最相似的结果作为提示,指导预训练语言模型进行代码生成,并且在该过程中固定模型的绝大多数参数以实现减少算力开销的目的。为了验证PPECG的有效性,文中选取了两个代码生成数据集,分别是CONCODE和Solidity4CG,通过计算生成结果的BLEU,CodeBLEU以及Exact Match值来验证PPECG的有效性,实验结果表明,PPECG有效地减少了微调时的显存开销,且在上述指标上基本接近甚至优于目前的SOTA方法,能够较好地完成代码生成的任务。 展开更多
关键词 代码生成 提示学习 预训练语言模型 信息检索 智能合约
下载PDF
基于层次聚类的图文检索模型研究
14
作者 孙健玮 刘玉龙 《计算机测量与控制》 2024年第6期286-291,298,共7页
图文检索在工业中的用途和作用是多方面的,可以帮助提高研发和生产效率,促进科技创新,提高产品的质量和竞争力;目前,图文检索模型的重点是提高检索的精度;随着技术和数据的快速发展,深度学习和大模型技术的不断应用,图文检索的速度问题... 图文检索在工业中的用途和作用是多方面的,可以帮助提高研发和生产效率,促进科技创新,提高产品的质量和竞争力;目前,图文检索模型的重点是提高检索的精度;随着技术和数据的快速发展,深度学习和大模型技术的不断应用,图文检索的速度问题逐渐凸显,为解决当前图文检索速度受限、计算量大的问题,提出了一种基于层次聚类的图文检索模型;该方法选择了检索效果明显的跨模态哈希方法,并运用深度聚类算法对待检索的数据进行分类,从而缩小检索范围,提高了检索速度;实验结果表明,基于层次聚类的图文检索模型在保持检索精度的同时,显著提高了检索速度,使得工程人员能够更快地获取到满意的检索结果。 展开更多
关键词 图文检索 跨模态哈希方法 深度学习 深度聚类算法 信息检索
下载PDF
面向业务需求的知识增强大模型生成框架技术研究
15
作者 纪威宇 张永 姜巍 《软件》 2024年第5期158-160,共3页
近年来,大模型技术方兴未艾,在通用领域获得长足发展。然而,在军事、政务等关键领域训练数据不足导致专业领域的大模型应用能力难以满足用户的需求,特别是针对业务需求的多类型数据检索任务,通用大模型存在瓶颈。本文提出一种知识增强... 近年来,大模型技术方兴未艾,在通用领域获得长足发展。然而,在军事、政务等关键领域训练数据不足导致专业领域的大模型应用能力难以满足用户的需求,特别是针对业务需求的多类型数据检索任务,通用大模型存在瓶颈。本文提出一种知识增强的大模型跨数据检索框架,设计一种知识融合生长的大模型检索能力演进机制,利用大模型的自监督信号驱动领域知识持续生成,同时利用积累的知识持续增强大模型检索能力,在典型业务场景下开展原型系统构建与试验验证,在典型场景下检验框架对用户业务信息的查询与结果生成能力,实验结果表明,高质量的知识有助于提高大模型生成结果的精准性与有效性。 展开更多
关键词 大模型 知识增强 跨数据检索
下载PDF
基于Go语言的安标产品信息检索系统设计
16
作者 汪学明 《软件》 2024年第3期34-36,47,共4页
本文介绍了一款基于Go语言的安标产品信息管理查询系统软件实现方法,该系统软件通过网络请求获取安标产品的综合信息,并打印显示出查询结果,同时将结果自动保存在Excel文件中。通过检索关键字,用户能够快速获取相关产品的详细信息,实现... 本文介绍了一款基于Go语言的安标产品信息管理查询系统软件实现方法,该系统软件通过网络请求获取安标产品的综合信息,并打印显示出查询结果,同时将结果自动保存在Excel文件中。通过检索关键字,用户能够快速获取相关产品的详细信息,实现了安标产品信息的快速检索与查询。论文详细阐述了基于Go语言的软件设计思路、实现过程和功能特点、实际应用场景和未来的改进方向。 展开更多
关键词 Go语言 安标产品 信息查询 快速检索
下载PDF
基于哈希算法的互联网平台数据中台资源检索方法
17
作者 梁艳春 阮宜龙 +1 位作者 李晨阳 张宏俊 《现代传输》 2024年第2期37-40,共4页
由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输... 由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输入数据进行清洗、去重、分词等预处理操作的基础上,使用词袋模型的方法,将文本转化为向量,再借助主成分分析法实现对向量的降维。在检索阶段,将与检索请求相似度最高(欧氏距离最小的)资源作为最终的检索输出结果。在测试结果中,资源检索方法面对不同类型的资源检索请求,对应的查准率稳定在91.0%以上,查全率稳定在90.0%以上。 展开更多
关键词 哈希算法 互联网平台 数据中台 资源检索 信息跨域检索 降维处理 词袋模型 主成分分析法 欧氏距离
下载PDF
基于Language Model的地理信息检索模型(英文) 被引量:3
18
作者 黎志升 王煦法 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第2期203-209,共7页
区别于传统的信息检索,地理信息检索通过一个查询范围词来限制用户的兴趣区域.目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果外.但是,词在地理空间的频率分布并不是均匀的,因此词在排序结果中的重... 区别于传统的信息检索,地理信息检索通过一个查询范围词来限制用户的兴趣区域.目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果外.但是,词在地理空间的频率分布并不是均匀的,因此词在排序结果中的重要性应该随着查询范围的变化而有所改变.为此,提出了一种新的基于语言模型的地理信息查询模型,把查询范围引入到传统的语言模型中.在该模型中,引入了一个local model来描述查询词的地理分布特性.实验结果表明,新的检索模型优于TF-IDF与传统的语言模型. 展开更多
关键词 语言模型 地理感知 地理 信息检索
下载PDF
ChatGPT影响下的人工智能档案服务:突破与挑战 被引量:5
19
作者 付永华 张文欣 司俊勇 《档案管理》 北大核心 2023年第3期58-61,共4页
ChatGPT以其“高级智能+普式应用”的科技姿态和应用场景,迅速被业界关注,引发各行试用,获得全球热议,更带来对人工智能应用的深思。在对人工智能驱动的档案服务研究现状和应用现状调研的基础上,从交互性、创新性、呈现性和开放性等视... ChatGPT以其“高级智能+普式应用”的科技姿态和应用场景,迅速被业界关注,引发各行试用,获得全球热议,更带来对人工智能应用的深思。在对人工智能驱动的档案服务研究现状和应用现状调研的基础上,从交互性、创新性、呈现性和开放性等视角出发,剖析了ChatGPT与档案服务的关联技术,提出人工智能驱动下的档案服务突破:所行所得、所想所得的检索服务,自然流畅、多模呈现的交互服务,创新挖掘、千用千面的知识服务,自组自调、动态融合的组织服务,主体完整、使用保障的安全服务和解忧除难、全程暖心的情感服务,给出人工智能驱动下的档案服务风险与挑战:性格泄露、服务偏差、技术崇拜、信息茧房、价值引导。为人工智能盛行背景下的档案服务,提供思路与建设参考,起到警醒作用。 展开更多
关键词 ChatGPT 人工智能 生成技术 多模态 跨模态 自然语言 信息茧房 档案服务
下载PDF
基于互信息解耦表示的跨域压力足迹图像检索
20
作者 张艳 许昌康 +3 位作者 曹丽青 王年 吴梦炎 夏懿 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期78-85,共8页
足迹作为人体生物特征之一,在生物识别领域具有重要意义,而同一对象的不同鞋型压力足迹图像在足迹轮廓特征上具有显著性差异,导致其类内差异大。针对压力足迹图像的跨域检索,文中提出了一种基于互信息解耦表示的跨域压力足迹图像检索方... 足迹作为人体生物特征之一,在生物识别领域具有重要意义,而同一对象的不同鞋型压力足迹图像在足迹轮廓特征上具有显著性差异,导致其类内差异大。针对压力足迹图像的跨域检索,文中提出了一种基于互信息解耦表示的跨域压力足迹图像检索方法。首先,构建了一个包含200人足迹图像的多域压力足迹数据集,从定性和定量两个角度分析跨域压力足迹图像的特点;其次,采用两个独立的编码器实现图像解耦模块,该模块将压力足迹图像解耦为域特定表示和域共享表示,通过域分类法保证域特定表示包含更多域相关的信息;然后,通过最小化互信息损失扩大域特定表示和域共享表示之间的距离,同时,为避免解耦过程中信息的丢失,基于域特定表示和域共享表示重构原始压力足迹图像;最后,通过特征提取模块进一步提取域共享表示的深层卷积特征,经过度量模块计算不同特征间的关联度,从而实现跨域压力足迹图像检索。对比及消融实验结果表明,该方法的解耦模块具有一定的有效性,在多域压力足迹数据集上的性能表现良好,首位查询结果的检索准确率达到79.83%,平均准确率达到65.48%。 展开更多
关键词 图像检索 跨域压力足迹 解耦表示 域共享表示 互信息
下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部