期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
利用BERT和覆盖率机制改进的HiNT文本检索模型
1
作者 邸剑 刘骏华 曹锦纲 《智能系统学报》 CSCD 北大核心 2024年第3期719-727,共9页
为有效提升文本语义检索的准确度,本文针对当前文本检索模型衡量查询和文档的相关性时不能很好地解决文本歧义和一词多义等问题,提出一种基于改进的分层神经匹配模型(hierarchical neural matching model,HiNT)。该模型先对文档的各个... 为有效提升文本语义检索的准确度,本文针对当前文本检索模型衡量查询和文档的相关性时不能很好地解决文本歧义和一词多义等问题,提出一种基于改进的分层神经匹配模型(hierarchical neural matching model,HiNT)。该模型先对文档的各个段提取关键主题词,然后用基于变换器的双向编码器(bidirectional encoder representations from transformers,BERT)模型将其编码为多个稠密的语义向量,再利用引入覆盖率机制的局部匹配层进行处理,使模型可以根据文档的局部段级别粒度和全局文档级别粒度进行相关性计算,提高检索的准确率。本文提出的模型在MS MARCO和webtext2019zh数据集上与多个检索模型进行对比,取得了最优结果,验证了本文提出模型的有效性。 展开更多
关键词 基于变换器的双向编码器 分层神经匹配模型 覆盖率机制 文本检索 语义表示 特征提取 自然语言处理 相似度 多粒度
下载PDF
基于模态语义增强的跨模态食谱检索方法
2
作者 李明 周栋 +1 位作者 雷芳 曹步清 《计算机应用研究》 CSCD 北大核心 2024年第4期1131-1137,共7页
在跨模态食谱检索任务中,如何有效地对模态进行特征表示是一个热点问题。目前一般使用两个独立的神经网络分别获取图像和食谱的特征,通过跨模态对齐实现跨模态检索。但这些方法主要关注模态内的特征信息,忽略了模态间的特征交互,导致部... 在跨模态食谱检索任务中,如何有效地对模态进行特征表示是一个热点问题。目前一般使用两个独立的神经网络分别获取图像和食谱的特征,通过跨模态对齐实现跨模态检索。但这些方法主要关注模态内的特征信息,忽略了模态间的特征交互,导致部分有效模态信息丢失。针对该问题,提出一种通过多模态编码器来增强模态语义的跨模态食谱检索方法。首先使用预训练模型提取图像和食谱的初始语义特征,并借助对抗损失缩小模态间差异;然后利用成对跨模态注意力使来自一个模态的特征反复强化另一个模态的特征,进一步提取有效信息;接着采用自注意力机制对模态的内部特征进行建模,以捕捉丰富的模态特定语义信息和潜在关联知识;最后,引入三元组损失最小化同类样本间的距离,实现跨模态检索学习。在Recipe 1M数据集上的实验结果表明,该方法在中位数排名(MedR)和前K召回率(R@K)等方面均优于目前的主流方法,为跨模态检索任务提供了有力的解决方案。 展开更多
关键词 跨模态食谱检索 特征提取 模态语义增强 多模态编码器
下载PDF
基于用户多媒体数据管理模型的个性化图像检索 被引量:3
3
作者 邱兆文 张田文 《电子学报》 EI CAS CSCD 北大核心 2008年第9期1746-1749,共4页
为了提高基于内容的图像检索系统的性能和减少图像底层视觉特征和高层语义特征之间的鸿沟,本文提出了用户多媒体数据管理模型.包括用户语义模型、用户兴趣模型和用户意图模型.实验证明用户多媒体数据管理模型可成功为用户提供个性化图... 为了提高基于内容的图像检索系统的性能和减少图像底层视觉特征和高层语义特征之间的鸿沟,本文提出了用户多媒体数据管理模型.包括用户语义模型、用户兴趣模型和用户意图模型.实验证明用户多媒体数据管理模型可成功为用户提供个性化图像检索和个性化推荐服务. 展开更多
关键词 个性化图像检索 用户语义模型 用户兴趣模型 用户意图模型
下载PDF
档案资源检索研究综述——基于中外档案学学术刊物分析 被引量:2
4
作者 房小可 《山西档案》 2019年第6期163-171,共9页
近年来,国内外学者对档案资源的检索进行了广泛探讨,本文以“档案资源检索”为主题对2000年以后国内外档案学刊物论文进行统计与内容分析,归纳出目前档案资源检索研究的主要学术观点,并对国内外研究进行对比从而总结出国内外档案资源检... 近年来,国内外学者对档案资源的检索进行了广泛探讨,本文以“档案资源检索”为主题对2000年以后国内外档案学刊物论文进行统计与内容分析,归纳出目前档案资源检索研究的主要学术观点,并对国内外研究进行对比从而总结出国内外档案资源检索研究特点与差异。 展开更多
关键词 档案信息资源 信息检索系统 检索方法 编码档案描述 语义信息
下载PDF
编码与提取方式对生成效应的影响
5
作者 水仁德 张莎 《心理学探新》 CSSCI 北大核心 2005年第1期28-31,共4页
实验采用两种编码方式和测验类型考查了编码与提取方式的一致性对生成效应的影响。结果显示:(1)在进行字形加工的知觉辨认测验中,生成过程主要依据字形编码的形近字出现了生成效应;主要依据字义编码的反义字没有出现此效应。(2)在依赖... 实验采用两种编码方式和测验类型考查了编码与提取方式的一致性对生成效应的影响。结果显示:(1)在进行字形加工的知觉辨认测验中,生成过程主要依据字形编码的形近字出现了生成效应;主要依据字义编码的反义字没有出现此效应。(2)在依赖字义提取的自由回忆中,形近字和反义字都出现了生成效应。因而编码与提取方式的一致性可能对生成效应有影响。 展开更多
关键词 提取方式 效应 编码方式 字形加工 生成过程 自由回忆 一致性 形近字 测验 反义 字义 知觉
下载PDF
基于BERT和引文上下文的文献表征与检索方法研究 被引量:10
6
作者 牛海波 赵丹群 郭倩影 《情报理论与实践》 CSSCI 北大核心 2020年第9期125-131,共7页
[目的/意义]文章提出了一种新的基于BERT和引文上下文的文献向量表征方法,旨在有效实现对文献的语义表征及检索。[方法/过程]基于arXiv数据库中"计算语言学"领域的相关文献数据,利用引文上下文将被引文献映射到全局唯一ID,构... [目的/意义]文章提出了一种新的基于BERT和引文上下文的文献向量表征方法,旨在有效实现对文献的语义表征及检索。[方法/过程]基于arXiv数据库中"计算语言学"领域的相关文献数据,利用引文上下文将被引文献映射到全局唯一ID,构造包含施引文献引文上下文和被引文献ID的训练语料,通过BERT预训练模型开展训练,将施引文献引文上下文与被引文献ID表征在同一向量空间,进而实现语义计算和检索。[结果/结论]与基于文献全文开展的文献检索方式相比,基于BERT和引文上下文的文献检索方法能够隐含编码被引文献引用强度、被引文献核心概念等关键信息,从而能够更好地表征被引文献。随后,文章开展了语义检索和相似文献发掘实验,结果证明该检索方法切实有效。 展开更多
关键词 引文上下文 BERT 文献表征 语义检索 文献关系挖掘
下载PDF
基于多表达的第一阶段语义检索模型 被引量:2
7
作者 蔡银琼 范意兴 +1 位作者 郭嘉丰 张儒清 《计算机工程与应用》 CSCD 北大核心 2023年第4期139-146,共8页
当前,信息检索系统通常采用“检索+重排序”的多级流水线架构。基于稠密表示的检索模型已经被逐渐应用到第一阶段检索中,并展现出了相比传统的稀疏向量空间模型更好的性能。考虑到第一阶段检索所需的高效性,大多数情况下这些模型的基本... 当前,信息检索系统通常采用“检索+重排序”的多级流水线架构。基于稠密表示的检索模型已经被逐渐应用到第一阶段检索中,并展现出了相比传统的稀疏向量空间模型更好的性能。考虑到第一阶段检索所需的高效性,大多数情况下这些模型的基本架构都采用双编码器(bi-encoder)结构。对查询和文档进行独立的编码,分别得到一个稠密表示向量,然后基于获得的查询和文档表示使用简单的相似度函数计算查询-文档对的得分。然而,在编码文档的过程中查询是不可知的,而且文档相比查询而言通常包含更多的主题信息,因此这种简单的单表示模型可能会造成严重的文档信息丢失。为了解决这个问题,设计了一种新的语义检索方法MDR(multi-representation dense retrieval),将文档编码成多个稠密向量表示。同时,该方法引入覆盖率(coverage)机制来保证多个向量之间的差异性,从而能够覆盖文档中不同主题的信息。为了评估模型性能,在MS MARCO数据集上进行了段落排序和文档排序任务,实验结果证明了MDR方法的有效性。 展开更多
关键词 语义检索 双编码器模型 信息检索
下载PDF
可搜索加密技术在金融交易行为中的应用
8
作者 刘宇琛 张留学 《湖南科技大学学报(自然科学版)》 CAS 北大核心 2024年第3期116-124,共9页
针对金融交易行为信息管理的安全问题,基于同态加密算法的原理,研究了分离码编解码、路径散列消息摘要和语义树索引算法.在此基础上,利用分离码编解码算法作为同态加密的加解密手段,结合路径散列消息摘要算法、语义树索引算法,构建金融... 针对金融交易行为信息管理的安全问题,基于同态加密算法的原理,研究了分离码编解码、路径散列消息摘要和语义树索引算法.在此基础上,利用分离码编解码算法作为同态加密的加解密手段,结合路径散列消息摘要算法、语义树索引算法,构建金融交易行为信息的安全存储方法及密文搜索系统.结果表明:利用分离码分组编码算法将信息转换为变换序列和位数序列,可以实现用密文建立全文检索;通过信息分组、路径散列计算、结果序列调和散列,结合输出字符串的设定,提出不可逆消息摘要的生成方法;基于语句的索引算法,采用密文搜索和原来语句搜索的一致性原则,构建密文搜索系统;构建的全文暨密文检索系统,可以实现密文的快速、安全检索,能够保证用户交易行为的数据、隐私、计算和分析的安全. 展开更多
关键词 金融交易行为 可搜索加密 分离编解码 密文检索 语义树搜索
原文传递
自闭症个体语义加工障碍综述 被引量:4
9
作者 黄静 梁丹丹 《当代语言学》 CSSCI 北大核心 2013年第3期349-358,378,共10页
近年许多研究关注自闭症个体语义加工,并发现他们在语义加工方面存在障碍,自由回忆词汇数量显著较少,语义聚合程度显著较低。"语义编码缺陷说"和"语义检索缺陷说"是目前解释自闭症个体语义加工障碍的两种代表性观... 近年许多研究关注自闭症个体语义加工,并发现他们在语义加工方面存在障碍,自由回忆词汇数量显著较少,语义聚合程度显著较低。"语义编码缺陷说"和"语义检索缺陷说"是目前解释自闭症个体语义加工障碍的两种代表性观点。自闭症个体回忆时加工水平效应的缺乏和检索提示回忆时的良好表现分别成为支持两种观点的最有力证据。 展开更多
关键词 自闭症个体 语义编 码语义检索
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部