期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
嵌入共识知识的因果图文检索方法
1
作者 梁彦鹏 刘雪儿 +1 位作者 马忠贵 李卓 《工程科学学报》 EI CSCD 北大核心 2024年第2期317-328,共12页
跨模态图像-文本检索是一项在给定一种模态(如文本)的查询条件下检索另一种模态(如图像)的任务.该任务的关键问题在于如何准确地测量图文两种模态之间的相似性,在减少视觉和语言这两种异构模态之间的视觉语义差异中起着至关重要的作用.... 跨模态图像-文本检索是一项在给定一种模态(如文本)的查询条件下检索另一种模态(如图像)的任务.该任务的关键问题在于如何准确地测量图文两种模态之间的相似性,在减少视觉和语言这两种异构模态之间的视觉语义差异中起着至关重要的作用.传统的检索范式依靠深度学习提取图像和文本的特征表示,并将其映射到一个公共表示空间中进行匹配.然而,这种方法更多地依赖数据表面的相关关系,无法挖掘数据背后真实的因果关系,在高层语义信息的表示和可解释性方面面临着挑战.为此,在深度学习的基础上引入因果推断和嵌入共识知识,提出嵌入共识知识的因果图文检索方法.具体而言,将因果干预引入视觉特征提取模块,通过因果关系替换相关关系学习常识因果视觉特征,并与原始视觉特征进行连接得到最终的视觉特征表示.为解决本方法文本特征表示不足的问题,采用更强大的文本特征提取模型BERT(Bidirectional encoder representations from transformers,双向编码器表示),并且嵌入两种模态数据之间共享的共识知识对图文特征进行共识级的表示学习.在MS-COCO数据集以及MS-COCO到Flickr30k上的跨数据集实验,证明了本文方法可以在双向图文检索任务上实现召回率和平均召回率的一致性改进. 展开更多
关键词 因果推断 图像-文本检索 跨模态 计算机视觉 自然语言处理
下载PDF
面向文本检索的语义计算 被引量:28
2
作者 赵军 金千里 徐波 《计算机学报》 EI CSCD 北大核心 2005年第12期2068-2078,共11页
随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检... 随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检索的两个关键技术(“标引”和“相似度计算”)中引入语义计算技术,用浅层语义来指导检索过程,提高检索准确率.针对“标引”技术,提出了语义树模型;针对“相似度计算”,基于语义张量的概念,结合自然语言处理的一些技术,提出三个可计算的窗口模型来近似语义张量的核心思想.以上工作在一定程度上实现了语义计算的功能.利用TREC数据集进行的评测表明,采用了语义计算技术后,文本检索的准确率可以提高10%左右. 展开更多
关键词 文本检索 自然语言处理 语义计算 语义树 语义张量 TREC评测
下载PDF
基于语义计算的查询扩展优化研究 被引量:10
3
作者 桑艳艳 刘培刚 李勇 《情报学报》 CSSCI 北大核心 2007年第5期704-710,共7页
查询扩展技术是指在原有查询的基础上加入与用户输入的检索用词相关联的新词,组成新的更长、更准确的查询,用于弥补用户查询信息不足的缺陷.为了提高文本检索的效率,纳入网络检索环境下的用户个人偏好,在查询扩展技术中引入语义计算是... 查询扩展技术是指在原有查询的基础上加入与用户输入的检索用词相关联的新词,组成新的更长、更准确的查询,用于弥补用户查询信息不足的缺陷.为了提高文本检索的效率,纳入网络检索环境下的用户个人偏好,在查询扩展技术中引入语义计算是一个重要研究方向.文章从语义计算的角度提出了基于语义关联树的查询扩展算法,通过动态生成语义关联树,有效降低词相似度矩阵计算工作量.通过控制语义关联树的层次结构及复杂度,灵活高效的生成不同语义空间模型.实验证明,该算法能有效提高文本检索的准确率. 展开更多
关键词 语义计算 查询扩展 语义关联树 文本检索
下载PDF
基于云计算及大数据技术的电力搜索引擎技术研究 被引量:28
4
作者 楼凤丹 裴旭斌 +1 位作者 王志强 纪德良 《电网与清洁能源》 北大核心 2016年第12期86-92,99,共8页
电力营销经过多年的信息化发展,企业内部已经建立大量异构型应用系统,产生了大量分散的结构化、半结构化、非结构化数据。基于云计算及大数据技术的电力"求索"搜索引擎技术,构建集中式数据中心全文检索的索引,实现对大规模不... 电力营销经过多年的信息化发展,企业内部已经建立大量异构型应用系统,产生了大量分散的结构化、半结构化、非结构化数据。基于云计算及大数据技术的电力"求索"搜索引擎技术,构建集中式数据中心全文检索的索引,实现对大规模不同业务功能和业务数据的统一检索,满足用户从大量异构业务系统和海量数据中进行快速检索的要求。电力"求索"搜索引擎技术基于开源的Elastic Search,利用分布式索引、分布式检索、分布式缓存技术,实现分布式全文检索平台,提供对大规模索引数据的高效管理与快速、灵活的访问能力。通过搜索引擎技术,综合利用文本挖掘、自然语言处理、信息检索等领域的技术,进一步提高全文检索的查准率、查全率。该技术的应用,可以满足大规模不同业务数据的统一检索的需求;并同时满足大规模数据检索请求的快速响应要求。 展开更多
关键词 ELASTIC SEARCH 电力 云计算 大数据 分布式全文检索 单点登录
下载PDF
基于文本集密度的特征选择与权重计算方案 被引量:8
5
作者 吴科 石冰 +1 位作者 卢军 牛小飞 《中文信息学报》 CSCD 北大核心 2004年第1期42-47,共6页
在信息检索的向量空间模型中 ,文本被形式化表示为由词语权重组成的向量。因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题。在这篇论文中 ,我们提出了一种基于文本集密度的特征词选择与权重计算方案的方... 在信息检索的向量空间模型中 ,文本被形式化表示为由词语权重组成的向量。因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题。在这篇论文中 ,我们提出了一种基于文本集密度的特征词选择与权重计算方案的方法。它是一种使用词对文本集密度的贡献衡量该词的价值的方法。使用这种方法 ,我们能找出不损失文本有效信息的最小特征词语集 ,并且创造出更为合理权重计算方案。在文中还用了一种新的衡量权重好坏的标准———元打分法 。 展开更多
关键词 计算机应用 中文信息处理 信息检索 文本集密度 权重计算方案 元打分法
下载PDF
面向信息检索的概念关系自动构建 被引量:6
6
作者 胡熠 陆汝占 刘慧 《中文信息学报》 CSCD 北大核心 2007年第5期46-50,共5页
概念之间的依存分析是提高信息检索性能的关键。相比概念关系的强弱而言,识别关系的类型更有意义。本文在Bootstrapping框架下,以"(地理)领属","(实体)功能"和"(动作)对象"三种语义关系类型为例,获得了... 概念之间的依存分析是提高信息检索性能的关键。相比概念关系的强弱而言,识别关系的类型更有意义。本文在Bootstrapping框架下,以"(地理)领属","(实体)功能"和"(动作)对象"三种语义关系类型为例,获得了构建上下文中两个概念特定关系的语义模板,并开发了一个名为SPG的系统。本文的工作:(1)引入了生物信息计算中序列比对的方法两两生成相似上下文的模板;(2)定义了新的模板评价机制估计模板的置信度。就这三种概念关系的识别而言,SPG获得的模板集合相比DIPRE系统获得了更高的正确率和覆盖能力。 展开更多
关键词 计算机应用 中文信息处理 文本检索模型 概念关系构建 BOOTSTRAPPING
下载PDF
《元朝秘史》电子文本检索系统的研制 被引量:3
7
作者 江荻 严海林 +2 位作者 孙伯君 斯钦朝克图 孟达来 《中文信息学报》 CSCD 北大核心 2006年第3期36-42,共7页
本文概要地介绍了13世纪《元朝秘史》的文献背景及原文所独有的复杂文本形式,通过对文本的内涵分析和版面分析,设计了关于《元朝秘史》电子检索系统的研制方案。其中主要解决了原文三行一体显示格式的还原问题,而且系统可以分别对原文... 本文概要地介绍了13世纪《元朝秘史》的文献背景及原文所独有的复杂文本形式,通过对文本的内涵分析和版面分析,设计了关于《元朝秘史》电子检索系统的研制方案。其中主要解决了原文三行一体显示格式的还原问题,而且系统可以分别对原文汉字音写、汉语译文、汉字旁译、语音语法标注等不同部分进行检索和统计。检索输出结果包括研究者最重视的传统学术章节号、卷页码、在电子文本出现的具体位置。另外,系统对检索词采用了上下文检索技术,输出文本包括检索词的部分上下文内容。本系统基本满足历史、文学和语言研究的应用需求。 展开更多
关键词 计算机应用 中文信息处理 元朝秘史 复杂文本 电子检索系统
下载PDF
中文全文数据库在医学科技期刊编辑工作中的作用 被引量:3
8
作者 汪勤俭 耿鹏 刘洪娥 《西南农业大学学报(社会科学版)》 2008年第2期186-187,共2页
简单介绍了我们常用的三种全文数据库(中国期刊全文数据库、维普中文科技期刊数据库和万方数字化期刊数据库)的收录范围及检索方法.在编辑工作中,合理的运用全文数据库,可以方便、快捷地协助编辑初审、组稿、选题、编辑加工、文献校对... 简单介绍了我们常用的三种全文数据库(中国期刊全文数据库、维普中文科技期刊数据库和万方数字化期刊数据库)的收录范围及检索方法.在编辑工作中,合理的运用全文数据库,可以方便、快捷地协助编辑初审、组稿、选题、编辑加工、文献校对等一系列工作,提高编辑效率,同时还可提高编辑自身素质,从而提高科技期刊的编辑质量。 展开更多
关键词 全文数据库 科技期刊 编辑 计算机检索
下载PDF
基于计算语言学的全文检索 被引量:3
9
作者 黄青松 《昆明理工大学学报(理工版)》 1997年第3期69-72,共4页
对全文检索系统的实现原理及途径进行了讨论,指出了传统方法存在的问题。
关键词 计算语言学 全文检索 信息处理 文档数据库
下载PDF
基于关系图的篇章分析方法及算法设计
10
作者 刘军万 刘飞飞 《中南林学院学报》 CSCD 2004年第5期93-97,共5页
 在简要介绍篇章的向量空间模型表示的基础上,讨论了基于段间相似度和关系图进行篇章分析的方法,包括:结构分析,主题分析和聚类,浏览与跳段阅读,最后讨论所存在的主要问题及进一步改进的意见.
关键词 分布式计算 软件设计 向量空间模型 信息检索 篇章理解 自然语言处理
下载PDF
一种改进的Wu-Manber多模式匹配算法及应用 被引量:10
11
作者 孙晓山 王强 +1 位作者 关毅 王晓龙 《中文信息学报》 CSCD 北大核心 2006年第2期47-52,共6页
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manbe... 本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。 展开更多
关键词 计算机应用 中文信息处理 多模式匹配 后缀模式 字符串匹配 全文检索 信息检索
下载PDF
文本相似度计算在企业信息检索中的应用
12
作者 黄炜 《科学技术与工程》 2011年第15期3571-3575,3584,共6页
企业信息检索系统所要解决的核心问题就是:提高检索关键字集合的规范性与完备性,通过对文本相似度计算及相关分类算法,达到检索关键字集合规范性及完备性提高的目的。给出了线性序列相似度的定义,讨论了匹配矩阵的性质,给出了一种计算... 企业信息检索系统所要解决的核心问题就是:提高检索关键字集合的规范性与完备性,通过对文本相似度计算及相关分类算法,达到检索关键字集合规范性及完备性提高的目的。给出了线性序列相似度的定义,讨论了匹配矩阵的性质,给出了一种计算线性序列相似度的算法,并对算法作出了优化。 展开更多
关键词 信息检索 文本相似度算法 全局优化 状态空间
下载PDF
基于词频-逆文档频率和法律本体的相似案例检索算法 被引量:1
13
作者 张云婷 叶麟 +1 位作者 方滨兴 张宏莉 《智能计算机与应用》 2021年第5期229-234,F0003,共7页
智慧检务是近年来研究的热点问题,而相似案例检索是智慧检务中公共法律服务模块的基本需求。传统的基于关键词的检索方式使案例的相似性仅局限在浅显的词语层面上,无法满足用户在文章和语义层面上的检索需求。针对公共法律服务中的相似... 智慧检务是近年来研究的热点问题,而相似案例检索是智慧检务中公共法律服务模块的基本需求。传统的基于关键词的检索方式使案例的相似性仅局限在浅显的词语层面上,无法满足用户在文章和语义层面上的检索需求。针对公共法律服务中的相似案例检索问题,该文以公共法律服务案例为研究对象,引入能够突出法律语义的案例要素,并以其为依据为案例建模,提出了一种基于语义的相似案例检索算法。该算法首先结合词频-逆文档频率和法律本体,提取出语料库中全部案例要素,再基于向量空间模型,通过欧氏距离计算出用户输入案例和语料库中各案例的相似程度,从而实现语义层面上的相似案例检索。通过对12348中国法网司法行政(法律服务)案例库中案例的分类实验可知,与传统的词频-逆文档频率提取关键词方法相比,该算法在监狱教改类案例分类上,其F1值提高了36.36%。 展开更多
关键词 语义检索 文本相似度计算 词频-逆文档频率 本体知识 案例要素
下载PDF
知识增益:文本分类中一种新的特征选择方法 被引量:6
14
作者 徐燕 王斌 +1 位作者 李锦涛 孙春明 《中文信息学报》 CSCD 北大核心 2008年第1期44-50,共7页
特征选择在文本分类中起重要的作用。文档频率(DF)、信息增益(IG)和互信息(MI)等特征选择方法在文本分类中广泛应用。已有的实验结果表明,IG是最有效的特征选择算法之一,该方法基于申农提出的信息论。本文基于粗糙集理论,提出了一种新... 特征选择在文本分类中起重要的作用。文档频率(DF)、信息增益(IG)和互信息(MI)等特征选择方法在文本分类中广泛应用。已有的实验结果表明,IG是最有效的特征选择算法之一,该方法基于申农提出的信息论。本文基于粗糙集理论,提出了一种新的特征选择方法(KG算法),该方法依据粗糙集理论关于知识的观点,即知识是分类事物的能力,将知识进行量化,提出知识增益的概念,得到基于知识增益的特征选择方法。在两个通用的语料集OHSUMED和NewsGroup上进行分类实验发现:KG算法均超过IG的性能,特别是在特征空间的维数降到低维时尤其明显,可见KG算法有较好的性能; 展开更多
关键词 计算机应用 中文信息处理 文本分类 特征选择 粗糙集 信息检索
下载PDF
一种基于DRDI的精确密文检索方案
15
作者 尹波 俞艺涵 +1 位作者 付伟 吴晓平 《计算机与数字工程》 2015年第6期1088-1091,共4页
针对云存储环境下的密文检索问题,面向精确密文检索需求设计了一种新型的精确密文全文索引方案DRDI(Different Rationality for Dual-Indexing)。该方案在密文检索技术和传统全文检索技术的研究基础上,对传统的倒排索引结构进行了改造,... 针对云存储环境下的密文检索问题,面向精确密文检索需求设计了一种新型的精确密文全文索引方案DRDI(Different Rationality for Dual-Indexing)。该方案在密文检索技术和传统全文检索技术的研究基础上,对传统的倒排索引结构进行了改造,建立多属性双索引,可高效检索出包含对应关键字的文件目录信息。实验结果表明该方案具有可行性和高效性的特点。 展开更多
关键词 云计算 密文检索 双索引
下载PDF
面向智能电网边缘计算的密文多关键字检索方法 被引量:2
16
作者 许爱东 朱静 +3 位作者 蒋屹新 张宇南 吴涛 蒋龙生 《计算机应用与软件》 北大核心 2022年第7期310-314,342,共6页
随着我国电网智能化升级的不断深入以及边缘计算技术的兴起,如何对电网边缘端存储的用电数据进行安全防护和按需检索成为实现电网边缘化智能计算的关键问题。对此提出一种新型直接索引结构方案,通过采用哈希SHA256算法产生一组码字数组... 随着我国电网智能化升级的不断深入以及边缘计算技术的兴起,如何对电网边缘端存储的用电数据进行安全防护和按需检索成为实现电网边缘化智能计算的关键问题。对此提出一种新型直接索引结构方案,通过采用哈希SHA256算法产生一组码字数组作为记录的索引,搜索时用户输入多关键字并产生对应的陷门,该陷门与索引进行精准匹配,并将所有匹配结果反馈给用户。该方案具有较低的空间复杂度;通过利用智能电表的采样数据,建立数学模型并验证了该方法的有效性。 展开更多
关键词 智能电网 哈希 密文检索 多关键字 边缘计算
下载PDF
A Survey of Web Information System and Applications
17
作者 HAN Yanbo LI Juanzi +3 位作者 YANG Nan LIU Qing XU Baowen MENG Xiaofeng 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期769-772,共4页
The fourth international conference on Web informa-tion systems and applications(WISA 2007) has received 409 sub-missions and has accepted 37 papers for publication in this issue. The papers cover broad research areas... The fourth international conference on Web informa-tion systems and applications(WISA 2007) has received 409 sub-missions and has accepted 37 papers for publication in this issue. The papers cover broad research areas,including Web mining and data warehouse,Deep Web and Web integration,P2P networks,text processing and information retrieval,as well as Web Services and Web infrastructure. After briefly introducing the WISA con-ference,the survey outlines the current activities and future trends concerning Web information systems and applications based on the papers accepted for publication. 展开更多
关键词 网络服务 数据库 网络集成 P2P计算技术
下载PDF
一种基于语义距离的关键词获取方法
18
作者 石爱萍 《计算机与现代化》 2010年第12期18-20,24,共4页
关键词作为文本的概要信息,是信息检索,特别是针对海量Web信息处理的基础。由于手工分配关键词是一项耗时性的工作,因此不需要训练集的非监督关键词获取方法研究受到了关注。本文以语义聚类为模型,以词在给定语境和词义本身两种语义距... 关键词作为文本的概要信息,是信息检索,特别是针对海量Web信息处理的基础。由于手工分配关键词是一项耗时性的工作,因此不需要训练集的非监督关键词获取方法研究受到了关注。本文以语义聚类为模型,以词在给定语境和词义本身两种语义距离的计算为基础,给出一种关键词获取算法。实验结果表明,该算法得到较好的查准率。 展开更多
关键词 词共现 聚类 语义距离 关键词获取
下载PDF
相关文献检索研究综述 被引量:2
19
作者 王军辉 胡铁军 李丹亚 《现代图书情报技术》 CSSCI 北大核心 2011年第1期39-45,共7页
从文献计量学角度对相关文献检索进行分类,分析其在具体实现过程中涉及到的关键技术,重点阐述PubMed和CBM相关文献检索的文本相似度计算方法、主要研究历程及最新研究进展,在对相关文献检索的评价方法和评价指标进行概述的基础上,从正... 从文献计量学角度对相关文献检索进行分类,分析其在具体实现过程中涉及到的关键技术,重点阐述PubMed和CBM相关文献检索的文本相似度计算方法、主要研究历程及最新研究进展,在对相关文献检索的评价方法和评价指标进行概述的基础上,从正反两方面对其效用进行分析,最后简要论述其发展方向。 展开更多
关键词 相关文献 相关文献检索 文本相似度计算 文献相关性数据库 相关知识
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部