期刊文献+
共找到211篇文章
< 1 2 11 >
每页显示 20 50 100
Natural Language Processing with Optimal Deep Learning-Enabled Intelligent Image Captioning System
1
作者 Radwa Marzouk Eatedal Alabdulkreem +5 位作者 Mohamed KNour Mesfer Al Duhayyim Mahmoud Othman Abu Sarwar Zamani Ishfaq Yaseen Abdelwahed Motwakel 《Computers, Materials & Continua》 SCIE EI 2023年第2期4435-4451,共17页
The recent developments in Multimedia Internet of Things(MIoT)devices,empowered with Natural Language Processing(NLP)model,seem to be a promising future of smart devices.It plays an important role in industrial models... The recent developments in Multimedia Internet of Things(MIoT)devices,empowered with Natural Language Processing(NLP)model,seem to be a promising future of smart devices.It plays an important role in industrial models such as speech understanding,emotion detection,home automation,and so on.If an image needs to be captioned,then the objects in that image,its actions and connections,and any silent feature that remains under-projected or missing from the images should be identified.The aim of the image captioning process is to generate a caption for image.In next step,the image should be provided with one of the most significant and detailed descriptions that is syntactically as well as semantically correct.In this scenario,computer vision model is used to identify the objects and NLP approaches are followed to describe the image.The current study develops aNatural Language Processing with Optimal Deep Learning Enabled Intelligent Image Captioning System(NLPODL-IICS).The aim of the presented NLPODL-IICS model is to produce a proper description for input image.To attain this,the proposed NLPODL-IICS follows two stages such as encoding and decoding processes.Initially,at the encoding side,the proposed NLPODL-IICS model makes use of Hunger Games Search(HGS)with Neural Search Architecture Network(NASNet)model.This model represents the input data appropriately by inserting it into a predefined length vector.Besides,during decoding phase,Chimp Optimization Algorithm(COA)with deeper Long Short Term Memory(LSTM)approach is followed to concatenate the description sentences 4436 CMC,2023,vol.74,no.2 produced by the method.The application of HGS and COA algorithms helps in accomplishing proper parameter tuning for NASNet and LSTM models respectively.The proposed NLPODL-IICS model was experimentally validated with the help of two benchmark datasets.Awidespread comparative analysis confirmed the superior performance of NLPODL-IICS model over other models. 展开更多
关键词 natural language processing information retrieval image captioning deep learning metaheuristics
下载PDF
Chinese-based research on subject-covered information retrieval supervised by textual semantic domain
2
作者 DU Jia-li LIU Yuan-yuan YU Ping-fang 《通讯和计算机(中英文版)》 2009年第7期68-78,共11页
关键词 NLP 语义结合 通信 SE
下载PDF
自然语言在Pubmed检索系统中的应用 被引量:3
3
作者 黄碧云 方平 《情报科学》 CSSCI 北大核心 2001年第11期1191-1192,1204,共3页
自然语言检索是情报检索的发展趋势。Pubmed检索系统通过自然语言自动转换及截词检索、词组的自动识别及特定符号的使用、限定检索范围、Preview/Index等功能,有效地克服了自然语言检索的局限,提高了检索效率。
关键词 自然语言检索 特点 查全率 检索范围 pubmed检索系统 情报检索 局限性
下载PDF
面向业务的资源按需解析模型构建研究
4
作者 刘耀 秦迅 刘天吉 《计算机科学》 CSCD 北大核心 2024年第10期178-186,共9页
针对在项目开发过程中新需求来临时,需要对自然语言处理工具和资源解析插件进行重新需求分析、重复开发等问题,提出了一套面向业务的资源按需解析方案。首先,提出了一种从需求到代码的资源按需解析方法,针对需求文本本身进行需求概念标... 针对在项目开发过程中新需求来临时,需要对自然语言处理工具和资源解析插件进行重新需求分析、重复开发等问题,提出了一套面向业务的资源按需解析方案。首先,提出了一种从需求到代码的资源按需解析方法,针对需求文本本身进行需求概念标引模型的构建。构建的需求概念标引模型的准确率、召回率、F1值等指标均高于其他分类模型。然后,针对需求文本与代码的关联,建立从需求文本到代码库类别的映射机制。对于模型的映射结果,使用前K准确率(percision@K)作为评价指标,最终准确率达到60%,具有一定的实用价值。综上所述,探索了一套具有需求解析能力、实现需求与代码关联的资源按需解析关键技术,并贯穿需求文本分类、需求代码库分类、代码库检索到插件生成的整个流程,形成了完整的“需求-代码-插件-解析”的业务闭环,通过实验验证了所提方法对于资源按需解析的有效性,为业务需求分析与软件复用提供了思路,与现有用于业务需求的解析和代码生成的大语言模型相比,所提方法聚焦于具体业务领域内的含有业务特点的插件代码复用全流程的实现。 展开更多
关键词 自然语言处理 需求模型 代码复用 文本解析 代码分类 代码检索
下载PDF
利用BERT和覆盖率机制改进的HiNT文本检索模型
5
作者 邸剑 刘骏华 曹锦纲 《智能系统学报》 CSCD 北大核心 2024年第3期719-727,共9页
为有效提升文本语义检索的准确度,本文针对当前文本检索模型衡量查询和文档的相关性时不能很好地解决文本歧义和一词多义等问题,提出一种基于改进的分层神经匹配模型(hierarchical neural matching model,HiNT)。该模型先对文档的各个... 为有效提升文本语义检索的准确度,本文针对当前文本检索模型衡量查询和文档的相关性时不能很好地解决文本歧义和一词多义等问题,提出一种基于改进的分层神经匹配模型(hierarchical neural matching model,HiNT)。该模型先对文档的各个段提取关键主题词,然后用基于变换器的双向编码器(bidirectional encoder representations from transformers,BERT)模型将其编码为多个稠密的语义向量,再利用引入覆盖率机制的局部匹配层进行处理,使模型可以根据文档的局部段级别粒度和全局文档级别粒度进行相关性计算,提高检索的准确率。本文提出的模型在MS MARCO和webtext2019zh数据集上与多个检索模型进行对比,取得了最优结果,验证了本文提出模型的有效性。 展开更多
关键词 基于变换器的双向编码器 分层神经匹配模型 覆盖率机制 文本检索 语义表示 特征提取 自然语言处理 相似度 多粒度
下载PDF
共享智慧,解读心愿:公共图书馆用户检索意图库构建关键技术与应用探析
6
作者 张宁 《四川图书馆学报》 2024年第3期54-62,共9页
随着数字化时代的到来,传统的关键词匹配检索方式已经无法满足用户个性化的信息需求。因此,构建用户检索意图库成为了解决这一问题的关键。通过收集和分析用户查询数据和目标数据,分析提取用户意图特征,并作为构建用户检索意图库的基本... 随着数字化时代的到来,传统的关键词匹配检索方式已经无法满足用户个性化的信息需求。因此,构建用户检索意图库成为了解决这一问题的关键。通过收集和分析用户查询数据和目标数据,分析提取用户意图特征,并作为构建用户检索意图库的基本要素,利用自然语言处理技术理解和识别用户检索意图,同时探析了用户检索意图构建过程中的三大关键技术,探讨了用户检索意图库在公共图书馆中的应用。 展开更多
关键词 公共图书馆 用户检索意图库 自然语言处理 特征提取
下载PDF
嵌入共识知识的因果图文检索方法 被引量:1
7
作者 梁彦鹏 刘雪儿 +1 位作者 马忠贵 李卓 《工程科学学报》 EI CSCD 北大核心 2024年第2期317-328,共12页
跨模态图像-文本检索是一项在给定一种模态(如文本)的查询条件下检索另一种模态(如图像)的任务.该任务的关键问题在于如何准确地测量图文两种模态之间的相似性,在减少视觉和语言这两种异构模态之间的视觉语义差异中起着至关重要的作用.... 跨模态图像-文本检索是一项在给定一种模态(如文本)的查询条件下检索另一种模态(如图像)的任务.该任务的关键问题在于如何准确地测量图文两种模态之间的相似性,在减少视觉和语言这两种异构模态之间的视觉语义差异中起着至关重要的作用.传统的检索范式依靠深度学习提取图像和文本的特征表示,并将其映射到一个公共表示空间中进行匹配.然而,这种方法更多地依赖数据表面的相关关系,无法挖掘数据背后真实的因果关系,在高层语义信息的表示和可解释性方面面临着挑战.为此,在深度学习的基础上引入因果推断和嵌入共识知识,提出嵌入共识知识的因果图文检索方法.具体而言,将因果干预引入视觉特征提取模块,通过因果关系替换相关关系学习常识因果视觉特征,并与原始视觉特征进行连接得到最终的视觉特征表示.为解决本方法文本特征表示不足的问题,采用更强大的文本特征提取模型BERT(Bidirectional encoder representations from transformers,双向编码器表示),并且嵌入两种模态数据之间共享的共识知识对图文特征进行共识级的表示学习.在MS-COCO数据集以及MS-COCO到Flickr30k上的跨数据集实验,证明了本文方法可以在双向图文检索任务上实现召回率和平均召回率的一致性改进. 展开更多
关键词 因果推断 图像-文本检索 跨模态 计算机视觉 自然语言处理
下载PDF
基于中文的亚洲英语共同体语料库的构建
8
作者 叶星妤 潘孝新 +3 位作者 秦晓惠 王龙 黄超 罗熊 《计算机技术与发展》 2024年第11期180-185,共6页
基于中文的亚洲英语共同体是中华文化的承载介体,是人类命运共同体的基本通用语之一。然而,缺乏大量的真实可信数据、科学的数据挖掘与自然语言处理方法,已成为制约基于中文的亚洲英语研究发展的关键技术问题。在分析相关研究现状的基础... 基于中文的亚洲英语共同体是中华文化的承载介体,是人类命运共同体的基本通用语之一。然而,缺乏大量的真实可信数据、科学的数据挖掘与自然语言处理方法,已成为制约基于中文的亚洲英语研究发展的关键技术问题。在分析相关研究现状的基础上,设计并实现了一个大数据驱动的基于中文的亚洲英语语料库并通过Web开发实现在线检索服务(Corpus of Chinese-based Asian English,CCbAE)。这是一个由六个基于中文的英语变体(中国内地英语、中国香港英语、中国台湾英语、中国澳门英语、新加坡英语、马来西亚英语)组合而成的大规模语料库。首先,简要说明了系统的总体架构和数据库构建。其次,结合Web可视化界面着重介绍了语料库的六大功能,分别为词频统计、特征展示、词汇变异、形态变异、句法变异、词义变异。该系统的设计与实现为不同层次的用户体,提供简捷易用的基于中文的亚洲英语语料检索服务。 展开更多
关键词 语料库 亚洲英语 大数据 语言检索 自然语言处理
下载PDF
基于大语言模型的电力知识库智能问答系统构建与评价
9
作者 张金营 王天堃 +5 位作者 么长英 谢华 柴林政 刘书恺 李彤亮 李舟军 《计算机科学》 CSCD 北大核心 2024年第12期286-292,共7页
大语言模型是近年来自然语言处理领域的一个重大突破,已成为该领域研究的一种新范式。在金融、法律等垂直领域,基于FinGPT,ChatLaw等垂直领域大模型的智能问答系统,促进了大模型技术在相关领域的学术研究与应用落地。然而,由于电力领域... 大语言模型是近年来自然语言处理领域的一个重大突破,已成为该领域研究的一种新范式。在金融、法律等垂直领域,基于FinGPT,ChatLaw等垂直领域大模型的智能问答系统,促进了大模型技术在相关领域的学术研究与应用落地。然而,由于电力领域缺乏相关的高质量数据,相关的大模型问答系统的构建工作遇到了较大阻碍。为了构建电力领域的智能问答系统,提出了基于大语言模型的电力知识库智能问答系统ChatPower。为了确保问答效果,ChatPower充分利用了电力管理各环节的数据。通过语义化理解,梳理和整合了大量的电力专业知识,精心设计和构建了一个较大规模的电力系统知识库。该知识库覆盖电力相关规章制度、安全生产管理体系以及发电设备故障知识等方面的内容。此外,通过参考检索到的电力知识,ChatPower显著缓解了问答中存在的模型幻觉问题,并在检索系统中引入了BM25检索、向量库检索与重排相结合的方法,有效降低了单纯依赖向量库检索的不准确性。同时,ChatPower结合基于大模型的提示工程技术,提升了对于规章制度类型问题生成回复的条理性。为了对问答系统进行评价,构建了一个电力知识问答的测试数据集,并对其进行了测试验证,测试结果表明:基于大语言模型的电力知识库问答系统ChatPower能够有效提升电力相关知识的检索和问答的准确性。 展开更多
关键词 大语言模型 知识库问答系统 信息检索 自然语言生成
下载PDF
基于知识图谱的零样本文档检索伪查询生成
10
作者 刘军平 孙医贵 +4 位作者 朱强 胡新荣 彭涛 姚迅 王帮超 《软件导刊》 2024年第11期47-52,共6页
为提高文档检索模型性能,减轻手工标记训练数据的工作量,提出一种基于知识图谱的零样本文档检索伪查询生成方法KGQG。该方法利用知识图谱增强伪查询,将外部信息与伪查询相结合,以生成更丰富、更具信息量的伪查询。实验结果表明,在BEIR... 为提高文档检索模型性能,减轻手工标记训练数据的工作量,提出一种基于知识图谱的零样本文档检索伪查询生成方法KGQG。该方法利用知识图谱增强伪查询,将外部信息与伪查询相结合,以生成更丰富、更具信息量的伪查询。实验结果表明,在BEIR基准测试的12个公开数据集中,KGQG方法比经典的稀疏检索模型、稠密检索模型以及最新的基于外部知识扩展的零样本稠密检索模型在归一化折现累计效益(NDCG)指标方面分别提升了4.6、11.88、7.96个百分点。KGQG方法不仅能提高检索性能,而且减少了手动标记训练数据需求,为文档检索模型的未来研究与应用提供了有益参考。 展开更多
关键词 稠密检索 信息检索 零样本学习 查询扩展 知识图谱 自然语言处理
下载PDF
智能检索技术在专利审查提质增效中的应用
11
作者 崔倩倩 《中国发明与专利》 2024年第S02期82-88,共7页
专利检索是提升专利审查质量和审查效率的关键环节,把握智能检索技术的应用特点、理解智能检索的技术原理、用好智能语义检索的干预手段对于提高专利检索效率、提升审查质量来说至关重要。本文以国家知识产权局专利审查和检索系统为主... 专利检索是提升专利审查质量和审查效率的关键环节,把握智能检索技术的应用特点、理解智能检索的技术原理、用好智能语义检索的干预手段对于提高专利检索效率、提升审查质量来说至关重要。本文以国家知识产权局专利审查和检索系统为主要示例,阐述检索系统的发展现状,深度挖掘智能检索技术的特点、揭示自然语言理解和语义检索的实质原理,并结合实际案例深入探索如何充分利用语义检索、语义分词、权重调整等干预手段来切实提高专利检索效率。 展开更多
关键词 智能检索 语义检索 自然语言理解 检索干预 检索效率
下载PDF
铁路自然语言大模型关键技术研究及应用展望
12
作者 史天运 李新琴 +3 位作者 代明睿 史维峰 李国华 杜文然 《中国铁路》 北大核心 2024年第7期7-14,共8页
人工智能自然语言大模型的涌现为行业深度赋能带来了新的曙光,研究铁路自然语言大模型关键技术及应用,对促进和统筹铁路人工智能发展具有重要意义。根据铁路人工智能应用需求,提出铁路自然语言大模型应用场景;依托铁路人工智能平台,设... 人工智能自然语言大模型的涌现为行业深度赋能带来了新的曙光,研究铁路自然语言大模型关键技术及应用,对促进和统筹铁路人工智能发展具有重要意义。根据铁路人工智能应用需求,提出铁路自然语言大模型应用场景;依托铁路人工智能平台,设计铁路自然语言大模型的总体架构,研究自然语言大模型关键技术,构建面向智能问答的铁路行业大模型,并以实际数据进行模型验证;最后从铁路运输组织、铁路运营安全、旅客服务方面对铁路自然语言大模型的发展和应用进行展望。 展开更多
关键词 智能高铁 人工智能 铁路自然语言大模型 应用场景 大模型架构 大模型微调 检索增强生成 铁路知识问答
下载PDF
智能对话系统中的自然语言生成方法研究与实践
13
作者 周铭 《计算机应用文摘》 2024年第22期128-130,共3页
智能对话系统是人工智能领域的一个重要研究方向,其中自然语言生成技术起着至关重要的作用。文章全面综述了智能对话系统中自然语言生成的主流方法,包括基于检索和生成的方法,以及二者的融合方式。在深入剖析各类方法的基础上,提出了一... 智能对话系统是人工智能领域的一个重要研究方向,其中自然语言生成技术起着至关重要的作用。文章全面综述了智能对话系统中自然语言生成的主流方法,包括基于检索和生成的方法,以及二者的融合方式。在深入剖析各类方法的基础上,提出了一种改进的融合式自然语言生成框架,通过实验验证了其有效性。研究表明,融合方法能够集成检索与生成的优点,在保证答复质量的同时提升了响应的多样性和用户交互体验,可为智能对话系统的进一步完善提供新的思路。 展开更多
关键词 智能对话系统 自然语言生成 信息检索 深度学习 融合方法
下载PDF
人工智能技术在档案检索与分类中的应用
14
作者 王浩 《计算机应用文摘》 2024年第17期85-87,共3页
文章深入研究了人工智能技术在档案检索与分类中的具体应用方法,旨在提高档案管理的智能化水平。首先,通过自然语言处理技术,系统能够理解和分析档案中的文本信息,使档案检索更智能化;其次,通过训练模型,系统能够根据档案的特征进行自... 文章深入研究了人工智能技术在档案检索与分类中的具体应用方法,旨在提高档案管理的智能化水平。首先,通过自然语言处理技术,系统能够理解和分析档案中的文本信息,使档案检索更智能化;其次,通过训练模型,系统能够根据档案的特征进行自动学习并不断优化检索策略,以提高档案检索的效率。在档案分类方面,通过自动识别和分类图像,系统能够更好地整理和管理档案,提高了档案分类的精度和效率。同时,通过模拟人脑神经网络的方式,深度学习能够更好地处理大规模、复杂的档案数据,实现更细致、准确的分类。 展开更多
关键词 人工智能技术 档案检索 档案分类 自然语言处理技术 深度学习
下载PDF
知识图谱构建技术综述 被引量:978
15
作者 刘峤 李杨 +2 位作者 段宏 刘瑶 秦志光 《计算机研究与发展》 EI CSCD 北大核心 2016年第3期582-600,共19页
谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明... 谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明,并给出了构建知识图谱的技术框架,按照输入的知识素材的抽象程度将其划分为3个层次:信息抽取层、知识融合层和知识加工层;2)分别对每个层次涉及的关键技术的研究现状进行分类说明,逐步揭示知识图谱技术的奥秘,及其与相关学科领域的关系;3)对知识图谱构建技术当前面临的重大挑战和关键问题进行了总结. 展开更多
关键词 知识图谱 语义网 信息检索 语义搜索引擎 自然语言处理
下载PDF
关键词自动标引的最大熵模型应用研究 被引量:93
16
作者 李素建 王厚峰 +1 位作者 俞士汶 辛乘胜 《计算机学报》 EI CSCD 北大核心 2004年第9期1192-1197,共6页
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现... 关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现有资源的实际情况 ,作者首先建立了最大熵模型的特征集合 ,然后提出了三种试验方法 ,并给出了相应的试验结果 ,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨 .该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示 . 展开更多
关键词 关键词标引 关键词抽取 最大熵模型 信息抽取
下载PDF
信息抽取研究综述 被引量:178
17
作者 李保利 陈玉忠 俞士汶 《计算机工程与应用》 CSCD 北大核心 2003年第10期1-5,66,共6页
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹—... 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。 展开更多
关键词 自然语言处理 信息抽取 信息检索 命名实体识别 计算机 信息处理
下载PDF
自然语言处理在信息检索中的应用综述 被引量:50
18
作者 王灿辉 张敏 马少平 《中文信息学报》 CSCD 北大核心 2007年第2期35-45,共11页
在信息检索①发展的过程中,研究者们不断尝试着将自然语言处理应用到检索里,希望能够为检索效果提高带来帮助。然而这些尝试的结果大多和研究者们最初的设想相反,自然语言处理在大多数情况下没有改进信息检索效果,甚至反而起了负面作用... 在信息检索①发展的过程中,研究者们不断尝试着将自然语言处理应用到检索里,希望能够为检索效果提高带来帮助。然而这些尝试的结果大多和研究者们最初的设想相反,自然语言处理在大多数情况下没有改进信息检索效果,甚至反而起了负面作用。即便有一些帮助,也往往是微小的,远远不如自然语言处理所需要的计算消耗那么大。研究者们对这些现象进行了分析,认为:自然语言处理更适合于应用在需要精确结果的任务中,例如问答系统、信息抽取等;自然语言处理需要针对信息检索进行优化才可能发挥积极作用。最新的一些进展(例如在语言模型中加入自然语言处理)在一定程度上印证了这一结论。 展开更多
关键词 人工智能 自然语言处理 综述 信息检索
下载PDF
问答式检索技术及评测研究综述 被引量:48
19
作者 吴友政 赵军 +1 位作者 段湘煜 徐波 《中文信息学报》 CSCD 北大核心 2005年第3期1-13,共13页
问答式检索系统(简称问答系统)是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎。它的出现旨在提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。经过这几年的发展,问答系统已经成为自然语言处理领域和信息检索领域... 问答式检索系统(简称问答系统)是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎。它的出现旨在提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。经过这几年的发展,问答系统已经成为自然语言处理领域和信息检索领域的一个重要分支和新兴的研究热点,其“通过系统化、大规模地定量评测推动研究向前发展”的发展轨迹,以及某些成功的启示,如基于字符表层的文本分析技术(模板技术)的有效性,快速、浅层自然语言处理技术的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾问答系统研究的历史,总结问答技术的研究现状,将有助于这方面工作向前发展。 展开更多
关键词 人工智能 自然语言处理 综述 问答系统 问答评测 信息抽取 信息检索
下载PDF
面向文本检索的语义计算 被引量:28
20
作者 赵军 金千里 徐波 《计算机学报》 EI CSCD 北大核心 2005年第12期2068-2078,共11页
随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检... 随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检索的两个关键技术(“标引”和“相似度计算”)中引入语义计算技术,用浅层语义来指导检索过程,提高检索准确率.针对“标引”技术,提出了语义树模型;针对“相似度计算”,基于语义张量的概念,结合自然语言处理的一些技术,提出三个可计算的窗口模型来近似语义张量的核心思想.以上工作在一定程度上实现了语义计算的功能.利用TREC数据集进行的评测表明,采用了语义计算技术后,文本检索的准确率可以提高10%左右. 展开更多
关键词 文本检索 自然语言处理 语义计算 语义树 语义张量 TREC评测
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部