期刊文献+
共找到396篇文章
< 1 2 20 >
每页显示 20 50 100
Bilingual Dictionary Approach for Malay-English Cross-Language Information Retrieval
1
作者 Nurjannaton Hidayah Rais Muhamad Taufik Abdullah Rabiah Abdul Kadir 《通讯和计算机(中英文版)》 2011年第5期354-360,共7页
关键词 跨语言信息检索 双语词典 英语 查询转换 语言翻译 翻译方法 语言表达 自动翻译
下载PDF
Query Expansion for Chinese Information Retrieval by Using a Decaying Co-occurrence Model 被引量:3
2
作者 贺宏朝 何丕廉 +1 位作者 高剑峰 黄昌宁 《Transactions of Tianjin University》 EI CAS 2002年第3期183-186,共4页
Query expansion with thesaurus is one of the useful techniques in modern information retrieval (IR). In this paper, a method of query expansion for Chinese IR by using a decaying co-occurrence model is proposed and re... Query expansion with thesaurus is one of the useful techniques in modern information retrieval (IR). In this paper, a method of query expansion for Chinese IR by using a decaying co-occurrence model is proposed and realized. The model is an extension of the traditional co-occurrence model by adding a decaying factor that decreases the mutual information when the distance between the terms increases. Experimental results on TREC-9 collections show this query expansion method results in significant improvements over the IR without query expansion. 展开更多
关键词 query expansion Chinese language information retrieval
下载PDF
Research on Cross-Language Retrieval Using Bilingual Word Vectors in Different Languages
3
作者 Yulong Li Dong Zhou 《国际计算机前沿大会会议论文集》 2019年第1期462-465,共4页
Bilingual word vectors have been exploited a lot in cross-language information retrieval research. However, most of the research is currently focused on similar language pairs. There are very few studies exploring the... Bilingual word vectors have been exploited a lot in cross-language information retrieval research. However, most of the research is currently focused on similar language pairs. There are very few studies exploring the impact of using bilingual word vectors for cross-language information retrieval in long-distance language pairs. In this paper, it systematically analyzes the retrieval performance of various European languages (English, German, Italian, French, Finnish, Dutch) as well as Asian languages (Chinese, Japanese) in the adhoc task of CLEF 2002–2003 campaign. Genetic proximity was used to visually represent the relationships between languages and compare their crosslingual retrieval performance in various settings. The results show that the differences in language vocabulary would dramatically affect the retrieval performance. At the same time, the term by term translation retrieval method performs slightly better than the simple vector addition retrieval methods. It proves that the translation-based retrieval model can still maintain its advantage under the new semantic scheme. 展开更多
关键词 cross-language information retrieval BILINGUAL word EMBEDDING Genetic PROXIMITY language PAIRS
下载PDF
A new approach to query expansion in information retrieval 被引量:2
4
作者 李卫疆 Zhao +2 位作者 Tiejun Wang Xian'gang 《High Technology Letters》 EI CAS 2008年第1期77-80,共4页
To eliminate the mismatch between words of relevant documents and user's query and more seriousnegative effects it has on the performance of information retrieval,a method of query expansion on the ba-sis of new t... To eliminate the mismatch between words of relevant documents and user's query and more seriousnegative effects it has on the performance of information retrieval,a method of query expansion on the ba-sis of new terms co-occurrence representation was put forward by analyzing the process of producingquery.The expansion terms were selected according to their correlation to the whole query.At the sametime,the position information between terms were considered.The experimental result on test retrievalconference(TREC)data collection shows that the method proposed in the paper has made an improve-ment of 5%~19% all the time than the language modeling method without expansion.Compared to thepopular approach of query expansion,pseudo feedback,the precision of the proposed method is competi-tive. 展开更多
关键词 information retrieval language model query expansion
下载PDF
New Retrieval Method Based on Relative Entropy for LanguageModeling with Different Smoothing Methods
5
作者 霍华 刘俊强 冯博琴 《Journal of Southwest Jiaotong University(English Edition)》 2006年第2期113-120,共8页
A language model for information retrieval is built by using a query language model to generate queries and a document language model to generate documents. The documents are ranked according to the relative entropies... A language model for information retrieval is built by using a query language model to generate queries and a document language model to generate documents. The documents are ranked according to the relative entropies of estimated document language models with respect to the estimated query language model. Two popular and relatively efficient smoothing methods, the Jelinek- Mercer method and the absolute discounting method, are used to smooth the document language model in estimation of the document language, A combined model composed of the feedback document language model and the collection language model is used to estimate the query model. A performacne comparison between the new retrieval method and the existing method with feedback is made, and the retrieval performances of the proposed method with the two different smoothing techniques are evaluated on three Text Retrieval Conference (TREC) data sets. Experimental results show that the method is effective and performs better than the basic language modeling approach; moreover, the method using the Jelinek-Mercer technique performs better than that using the absolute discounting technique, and the perfomance is sensitive to the smoothing peramters. 展开更多
关键词 information retrieval Relative entropy language modeling SMOOTHING
下载PDF
Chinese-based research on subject-covered information retrieval supervised by textual semantic domain
6
作者 DU Jia-li LIU Yuan-yuan YU Ping-fang 《通讯和计算机(中英文版)》 2009年第7期68-78,共11页
关键词 NLP 语义结合 通信 SE
下载PDF
基于Language Model的地理信息检索模型(英文) 被引量:3
7
作者 黎志升 王煦法 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第2期203-209,共7页
区别于传统的信息检索,地理信息检索通过一个查询范围词来限制用户的兴趣区域.目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果外.但是,词在地理空间的频率分布并不是均匀的,因此词在排序结果中的重... 区别于传统的信息检索,地理信息检索通过一个查询范围词来限制用户的兴趣区域.目前的技术一般是把该查询范围词作为一个过滤器,将在该范围之外的文档排除在查询结果外.但是,词在地理空间的频率分布并不是均匀的,因此词在排序结果中的重要性应该随着查询范围的变化而有所改变.为此,提出了一种新的基于语言模型的地理信息查询模型,把查询范围引入到传统的语言模型中.在该模型中,引入了一个local model来描述查询词的地理分布特性.实验结果表明,新的检索模型优于TF-IDF与传统的语言模型. 展开更多
关键词 语言模型 地理感知 地理 信息检索
下载PDF
Natural Language Processing with Optimal Deep Learning-Enabled Intelligent Image Captioning System
8
作者 Radwa Marzouk Eatedal Alabdulkreem +5 位作者 Mohamed KNour Mesfer Al Duhayyim Mahmoud Othman Abu Sarwar Zamani Ishfaq Yaseen Abdelwahed Motwakel 《Computers, Materials & Continua》 SCIE EI 2023年第2期4435-4451,共17页
The recent developments in Multimedia Internet of Things(MIoT)devices,empowered with Natural Language Processing(NLP)model,seem to be a promising future of smart devices.It plays an important role in industrial models... The recent developments in Multimedia Internet of Things(MIoT)devices,empowered with Natural Language Processing(NLP)model,seem to be a promising future of smart devices.It plays an important role in industrial models such as speech understanding,emotion detection,home automation,and so on.If an image needs to be captioned,then the objects in that image,its actions and connections,and any silent feature that remains under-projected or missing from the images should be identified.The aim of the image captioning process is to generate a caption for image.In next step,the image should be provided with one of the most significant and detailed descriptions that is syntactically as well as semantically correct.In this scenario,computer vision model is used to identify the objects and NLP approaches are followed to describe the image.The current study develops aNatural Language Processing with Optimal Deep Learning Enabled Intelligent Image Captioning System(NLPODL-IICS).The aim of the presented NLPODL-IICS model is to produce a proper description for input image.To attain this,the proposed NLPODL-IICS follows two stages such as encoding and decoding processes.Initially,at the encoding side,the proposed NLPODL-IICS model makes use of Hunger Games Search(HGS)with Neural Search Architecture Network(NASNet)model.This model represents the input data appropriately by inserting it into a predefined length vector.Besides,during decoding phase,Chimp Optimization Algorithm(COA)with deeper Long Short Term Memory(LSTM)approach is followed to concatenate the description sentences 4436 CMC,2023,vol.74,no.2 produced by the method.The application of HGS and COA algorithms helps in accomplishing proper parameter tuning for NASNet and LSTM models respectively.The proposed NLPODL-IICS model was experimentally validated with the help of two benchmark datasets.Awidespread comparative analysis confirmed the superior performance of NLPODL-IICS model over other models. 展开更多
关键词 Natural language processing information retrieval image captioning deep learning metaheuristics
下载PDF
基于大模型的电子信息领域知识图谱自动构建与检索技术
9
作者 谢明华 《电讯技术》 北大核心 2024年第8期1228-1234,共7页
当前电子信息领域积累的越来越多宝贵经验知识对知识使用技术提出了新的挑战。知识图谱(Knowledge Graph, KG)技术和大规模预训练语言模型(Large Language Model, LLM)技术在知识使用方面都各自存在缺陷,但两种技术的优缺点能够形成互... 当前电子信息领域积累的越来越多宝贵经验知识对知识使用技术提出了新的挑战。知识图谱(Knowledge Graph, KG)技术和大规模预训练语言模型(Large Language Model, LLM)技术在知识使用方面都各自存在缺陷,但两种技术的优缺点能够形成互补。因此,基于LLM技术,提出了应用于电子信息领域的知识图谱自动构建与检索增强问答技术。首先基于LLM的语义理解能力自动构建电子信息领域知识图谱,然后构建基于知识图谱和检索增强大模型的知识问答系统。在CoNLL2003数据集和构建的电子信息领域数据集上的实验证明了所方法具有较好质量,知识问答系统具有较好的实用效果。所提方法能够更好地满足从业人员从海量文档中提取相关知识,提高知识利用效率的迫切需求,为推动大模型结合知识图谱技术在电子信息垂直领域的落地应用提供参考。 展开更多
关键词 电子信息领域 知识图谱构建 检索增强 大模型
下载PDF
大语言模型增强的知识图谱问答研究进展综述
10
作者 冯拓宇 李伟平 +3 位作者 郭庆浪 王刚亮 张雨松 乔子剑 《计算机科学与探索》 CSCD 北大核心 2024年第11期2887-2900,共14页
知识图谱问答(knowledge graph question answering,KGQA)是一种通过处理用户提出的自然语言问题,从知识图谱中获取相关答案的技术。早期的知识图谱问答技术受到知识图谱规模、计算能力以及自然语言处理能力的限制,准确率较低。近年来,... 知识图谱问答(knowledge graph question answering,KGQA)是一种通过处理用户提出的自然语言问题,从知识图谱中获取相关答案的技术。早期的知识图谱问答技术受到知识图谱规模、计算能力以及自然语言处理能力的限制,准确率较低。近年来,随着人工智能技术的进步,特别是大语言模型(large language model,LLM)的发展,知识图谱问答技术的性能得到显著提升。大语言模型如GPT-3等已经被广泛应用于增强知识图谱问答的性能。为了更好地研究学习增强知识图谱问答的技术,对现有的各种大语言模型增强的知识图谱问答方法进行了归纳分析。总结了大语言模型和知识图谱问答的相关知识,即大语言模型的技术原理、训练方法,以及知识图谱、问答和知识图谱问答的基本概念。从语义解析和信息检索两个维度,综述了大语言模型增强知识图谱问答的现有方法,分析了方法所解决的问题及其局限性。收集整理了大语言模型增强知识图谱问答的相关资源和评测方法,并对现有方法的性能表现进行了总结。最后针对现有方法的局限性,分析并提出了未来的重点研究方向。 展开更多
关键词 大语言模型 知识图谱问答 语义解析 信息检索
下载PDF
基于大语言模型的电力知识库智能问答系统构建与评价
11
作者 张金营 王天堃 +5 位作者 么长英 谢华 柴林政 刘书恺 李彤亮 李舟军 《计算机科学》 CSCD 北大核心 2024年第12期286-292,共7页
大语言模型是近年来自然语言处理领域的一个重大突破,已成为该领域研究的一种新范式。在金融、法律等垂直领域,基于FinGPT,ChatLaw等垂直领域大模型的智能问答系统,促进了大模型技术在相关领域的学术研究与应用落地。然而,由于电力领域... 大语言模型是近年来自然语言处理领域的一个重大突破,已成为该领域研究的一种新范式。在金融、法律等垂直领域,基于FinGPT,ChatLaw等垂直领域大模型的智能问答系统,促进了大模型技术在相关领域的学术研究与应用落地。然而,由于电力领域缺乏相关的高质量数据,相关的大模型问答系统的构建工作遇到了较大阻碍。为了构建电力领域的智能问答系统,提出了基于大语言模型的电力知识库智能问答系统ChatPower。为了确保问答效果,ChatPower充分利用了电力管理各环节的数据。通过语义化理解,梳理和整合了大量的电力专业知识,精心设计和构建了一个较大规模的电力系统知识库。该知识库覆盖电力相关规章制度、安全生产管理体系以及发电设备故障知识等方面的内容。此外,通过参考检索到的电力知识,ChatPower显著缓解了问答中存在的模型幻觉问题,并在检索系统中引入了BM25检索、向量库检索与重排相结合的方法,有效降低了单纯依赖向量库检索的不准确性。同时,ChatPower结合基于大模型的提示工程技术,提升了对于规章制度类型问题生成回复的条理性。为了对问答系统进行评价,构建了一个电力知识问答的测试数据集,并对其进行了测试验证,测试结果表明:基于大语言模型的电力知识库问答系统ChatPower能够有效提升电力相关知识的检索和问答的准确性。 展开更多
关键词 大语言模型 知识库问答系统 信息检索 自然语言生成
下载PDF
基于提示学习的轻量化代码生成方法
12
作者 徐一然 周宇 《计算机科学》 CSCD 北大核心 2024年第6期61-67,共7页
代码自动生成是提高软件开发效率的有效途径之一,已有的研究一般将代码生成作为一项序列到序列的任务,并且大规模预训练语言模型的微调过程往往伴随着高昂的算力开销。文中提出了一种基于提示学习的轻量化代码生成方法(Prompt Learning ... 代码自动生成是提高软件开发效率的有效途径之一,已有的研究一般将代码生成作为一项序列到序列的任务,并且大规模预训练语言模型的微调过程往往伴随着高昂的算力开销。文中提出了一种基于提示学习的轻量化代码生成方法(Prompt Learning based Parameter-Efficient Code Generation,PPECG),该方法通过查询代码语料库中与当前需求最相似的结果作为提示,指导预训练语言模型进行代码生成,并且在该过程中固定模型的绝大多数参数以实现减少算力开销的目的。为了验证PPECG的有效性,文中选取了两个代码生成数据集,分别是CONCODE和Solidity4CG,通过计算生成结果的BLEU,CodeBLEU以及Exact Match值来验证PPECG的有效性,实验结果表明,PPECG有效地减少了微调时的显存开销,且在上述指标上基本接近甚至优于目前的SOTA方法,能够较好地完成代码生成的任务。 展开更多
关键词 代码生成 提示学习 预训练语言模型 信息检索 智能合约
下载PDF
基于知识图谱的零样本文档检索伪查询生成
13
作者 刘军平 孙医贵 +4 位作者 朱强 胡新荣 彭涛 姚迅 王帮超 《软件导刊》 2024年第11期47-52,共6页
为提高文档检索模型性能,减轻手工标记训练数据的工作量,提出一种基于知识图谱的零样本文档检索伪查询生成方法KGQG。该方法利用知识图谱增强伪查询,将外部信息与伪查询相结合,以生成更丰富、更具信息量的伪查询。实验结果表明,在BEIR... 为提高文档检索模型性能,减轻手工标记训练数据的工作量,提出一种基于知识图谱的零样本文档检索伪查询生成方法KGQG。该方法利用知识图谱增强伪查询,将外部信息与伪查询相结合,以生成更丰富、更具信息量的伪查询。实验结果表明,在BEIR基准测试的12个公开数据集中,KGQG方法比经典的稀疏检索模型、稠密检索模型以及最新的基于外部知识扩展的零样本稠密检索模型在归一化折现累计效益(NDCG)指标方面分别提升了4.6、11.88、7.96个百分点。KGQG方法不仅能提高检索性能,而且减少了手动标记训练数据需求,为文档检索模型的未来研究与应用提供了有益参考。 展开更多
关键词 稠密检索 信息检索 零样本学习 查询扩展 知识图谱 自然语言处理
下载PDF
基于Go语言的安标产品信息检索系统设计
14
作者 汪学明 《软件》 2024年第3期34-36,47,共4页
本文介绍了一款基于Go语言的安标产品信息管理查询系统软件实现方法,该系统软件通过网络请求获取安标产品的综合信息,并打印显示出查询结果,同时将结果自动保存在Excel文件中。通过检索关键字,用户能够快速获取相关产品的详细信息,实现... 本文介绍了一款基于Go语言的安标产品信息管理查询系统软件实现方法,该系统软件通过网络请求获取安标产品的综合信息,并打印显示出查询结果,同时将结果自动保存在Excel文件中。通过检索关键字,用户能够快速获取相关产品的详细信息,实现了安标产品信息的快速检索与查询。论文详细阐述了基于Go语言的软件设计思路、实现过程和功能特点、实际应用场景和未来的改进方向。 展开更多
关键词 Go语言 安标产品 信息查询 快速检索
下载PDF
智能对话系统中的自然语言生成方法研究与实践
15
作者 周铭 《计算机应用文摘》 2024年第22期128-130,共3页
智能对话系统是人工智能领域的一个重要研究方向,其中自然语言生成技术起着至关重要的作用。文章全面综述了智能对话系统中自然语言生成的主流方法,包括基于检索和生成的方法,以及二者的融合方式。在深入剖析各类方法的基础上,提出了一... 智能对话系统是人工智能领域的一个重要研究方向,其中自然语言生成技术起着至关重要的作用。文章全面综述了智能对话系统中自然语言生成的主流方法,包括基于检索和生成的方法,以及二者的融合方式。在深入剖析各类方法的基础上,提出了一种改进的融合式自然语言生成框架,通过实验验证了其有效性。研究表明,融合方法能够集成检索与生成的优点,在保证答复质量的同时提升了响应的多样性和用户交互体验,可为智能对话系统的进一步完善提供新的思路。 展开更多
关键词 智能对话系统 自然语言生成 信息检索 深度学习 融合方法
下载PDF
知识图谱构建技术综述 被引量:978
16
作者 刘峤 李杨 +2 位作者 段宏 刘瑶 秦志光 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期582-600,共19页
谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明... 谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明,并给出了构建知识图谱的技术框架,按照输入的知识素材的抽象程度将其划分为3个层次:信息抽取层、知识融合层和知识加工层;2)分别对每个层次涉及的关键技术的研究现状进行分类说明,逐步揭示知识图谱技术的奥秘,及其与相关学科领域的关系;3)对知识图谱构建技术当前面临的重大挑战和关键问题进行了总结. 展开更多
关键词 知识图谱 语义网 信息检索 语义搜索引擎 自然语言处理
下载PDF
信息抽取研究综述 被引量:178
17
作者 李保利 陈玉忠 俞士汶 《计算机工程与应用》 CSCD 北大核心 2003年第10期1-5,66,共6页
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹—... 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。 展开更多
关键词 自然语言处理 信息抽取 信息检索 命名实体识别 计算机 信息处理
下载PDF
关键词自动标引的最大熵模型应用研究 被引量:93
18
作者 李素建 王厚峰 +1 位作者 俞士汶 辛乘胜 《计算机学报》 EI CSCD 北大核心 2004年第9期1192-1197,共6页
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现... 关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现有资源的实际情况 ,作者首先建立了最大熵模型的特征集合 ,然后提出了三种试验方法 ,并给出了相应的试验结果 ,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨 .该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示 . 展开更多
关键词 关键词标引 关键词抽取 最大熵模型 信息抽取
下载PDF
基于英汉机译实现跨语言信息检索 被引量:10
19
作者 张玥杰 郭依昆 +1 位作者 连理 吴立德 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1135-1140,共6页
随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形 ,变得越来越普遍 .这就产生一个非常重要的问题—以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题 ,也就是一种如何跨越语言界限的问题 ,即... 随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形 ,变得越来越普遍 .这就产生一个非常重要的问题—以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题 ,也就是一种如何跨越语言界限的问题 ,即跨语言信息检索 (Cross- L anguage Information Retrieval,CL IR) .针对该项任务建立了一个面向英汉的跨语言信息检索系统 ,并以此为基础提交了相关的几组运行结果 .同时 ,结合所构建的汉语 IR系统 ,实现完整的英—汉 CL 展开更多
关键词 信息检索 跨语言信息检索 机器翻译 语料库 语言学资源
下载PDF
文本检索的统计语言建模方法综述 被引量:19
20
作者 丁国栋 白硕 王斌 《计算机研究与发展》 EI CSCD 北大核心 2006年第5期769-776,共8页
统计语言建模技术(statisticallanguagemodeling,SLM)已逐渐成为当前语言信息处理的主流技术之一·近几年的研究和实验表明,SLM技术在文本检索领域有着广阔的发展前景和拓展空间·对基于SLM的文本检索方法(SLMTR)进行了综述,重... 统计语言建模技术(statisticallanguagemodeling,SLM)已逐渐成为当前语言信息处理的主流技术之一·近几年的研究和实验表明,SLM技术在文本检索领域有着广阔的发展前景和拓展空间·对基于SLM的文本检索方法(SLMTR)进行了综述,重点论述SLMTR的主要方法和关键技术·首先对查询似然检索模型进行形式化的描述;然后详细论述语言模型的估计和数据平滑问题;并讨论了平滑对检索性能的影响;之后简要介绍了对查询似然模型的一些主要的扩展和改进工作;最后的总结部分讨论了SLMTR所面临的一些挑战· 展开更多
关键词 信息检索 统计语言建模 语言模型 平滑
下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部