期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于抽取式机器阅读理解的多文件汇编问答技术研究
1
作者 秦春凯 冯延钊 +2 位作者 陈瑞恒 刘珊 徐畅 《山东通信技术》 2024年第3期27-30,共4页
研究一种基于抽取式机器阅读理解的多文件汇编问答技术,解决当前多文件问答系统中存在的生成答案可信度不足、处理文件能力有限、计算复杂度高等问题。通过滑动窗口切分保留文本块上下文信息,采用BM25算法计算特征向量并持久化存储于分... 研究一种基于抽取式机器阅读理解的多文件汇编问答技术,解决当前多文件问答系统中存在的生成答案可信度不足、处理文件能力有限、计算复杂度高等问题。通过滑动窗口切分保留文本块上下文信息,采用BM25算法计算特征向量并持久化存储于分布式数据库,结合抽取式机器阅读理解模型进行问答。实验结果表明,该方法显著提高了问答的准确率,多文件汇编问答技术为高效、准确的信息检索与问答提供了新途径。 展开更多
关键词 多文件 汇编问答 抽取机器阅读理解
下载PDF
片段抽取型机器阅读理解算法研究 被引量:3
2
作者 叶俊民 赵晓丽 +1 位作者 杜翔 姚贤坦 《计算机应用研究》 CSCD 北大核心 2021年第11期3268-3273,共6页
针对现有的机器阅读理解模型主要使用循环模型处理文本序列信息,这容易导致训练和预测速度慢且模型预测准确性不高等问题,提出了一种片段抽取型机器阅读理解算法QA-Reader。该算法利用大型预训练语言模型RoBERTa-www-ext获取问题和上下... 针对现有的机器阅读理解模型主要使用循环模型处理文本序列信息,这容易导致训练和预测速度慢且模型预测准确性不高等问题,提出了一种片段抽取型机器阅读理解算法QA-Reader。该算法利用大型预训练语言模型RoBERTa-www-ext获取问题和上下文的词嵌入表示;使用深度可分离卷积和多头自注意力机制进行编码;计算上下文和问题的双向注意力及上下文的自注意力,以融合上下文和问题之间的关联信息,拼接得到最终的语义表征;经过模型编码器预测得到答案,模型针对不可回答的问题计算了其不可回答的概率。在中文片段抽取型机器阅读理解数据集上进行了实验,结果表明QA-Reader模型与基线模型相比,其性能方面EM和F 1值分别提高了3.821%、2.740%,训练速度提高了0.089%。 展开更多
关键词 机器阅读理解 片段抽取机器阅读理解 RoBERTa-www-ext 卷积神经网络 注意力机制
下载PDF
抽取式机器阅读理解研究综述 被引量:7
3
作者 包玥 李艳玲 林民 《计算机工程与应用》 CSCD 北大核心 2021年第12期25-36,共12页
机器阅读理解要求机器能够理解自然语言文本并回答相关问题,是自然语言处理领域的核心技术,也是自然语言处理领域最具挑战性的任务之一。抽取式机器阅读理解是机器阅读理解任务中一个重要的分支,因其更贴合实际情况,更能够反映机器的理... 机器阅读理解要求机器能够理解自然语言文本并回答相关问题,是自然语言处理领域的核心技术,也是自然语言处理领域最具挑战性的任务之一。抽取式机器阅读理解是机器阅读理解任务中一个重要的分支,因其更贴合实际情况,更能够反映机器的理解能力,成为当前学术界和工业界的研究热点。对抽取式机器阅读理解从以下四个方面进行了全面地综述:介绍了机器阅读理解任务及其发展历程;介绍了抽取式机器阅读理解任务以及其现阶段存在的难点;对抽取式机器阅读理解任务的主要数据集及方法进行了梳理总结;讨论了抽取式机器阅读理解的未来发展方向。 展开更多
关键词 抽取机器阅读理解 自然语言处理 深度学习 迁移学习 注意力机制
下载PDF
基于词向量和神经网络融合的过程构成要素信息抽取方法 被引量:2
4
作者 吴路路 刘卫东 +2 位作者 肖胜辉 陈炳松 聂文滨 《南昌大学学报(理科版)》 CAS 北大核心 2018年第3期274-282,共9页
工步过程构成要素的分析与提取是工艺过程质量管理极为重要的工作内容。为实现工步过程构成要素的机器识别,基于工艺指令确定工步、工步确定其构成要素的逻辑关系,本文将词向量和神经网络相结合,提出了一种工步过程构成要素的关系拟合... 工步过程构成要素的分析与提取是工艺过程质量管理极为重要的工作内容。为实现工步过程构成要素的机器识别,基于工艺指令确定工步、工步确定其构成要素的逻辑关系,本文将词向量和神经网络相结合,提出了一种工步过程构成要素的关系拟合模型。该模型充分利用词向量的语义表示能力,对描述和确定工艺过程的工艺指令文件语料中的词语进行表示,进而得到每条工艺指令、工步过程及其构成要素的句向量表示,同时利用神经网络对非线性映射关系的拟合能力,抽取出工艺指令与工步过程、工步过程与其构成要素之间的关系。该方法应用于飞机装配工序的研究,各工艺指令的工步过程及其构成要素抽取结果的综合准确率不低于90%,验证了方法的有效性。 展开更多
关键词 工艺过程构成要素 机器抽取 词向量 神经网络 工艺失效模式分析
下载PDF
科技文献元数据自动抽取研究述评 被引量:6
5
作者 龚立群 马宝英 常晓荣 《计算机系统应用》 2013年第3期11-15,共5页
首先从元数据的属性和元数据的粒度两个角度对科技文献元数据进行了分析,在此基础上,从科技文献元数据自动抽取的理论研究和应用实践研究两个方面对国内外科技文献元数据自动抽取研究成果进行分析和综合,最后指出了现有研究的特点和存... 首先从元数据的属性和元数据的粒度两个角度对科技文献元数据进行了分析,在此基础上,从科技文献元数据自动抽取的理论研究和应用实践研究两个方面对国内外科技文献元数据自动抽取研究成果进行分析和综合,最后指出了现有研究的特点和存在的不足. 展开更多
关键词 科技文献 元数据自动抽取 基于规则的抽取 基于模板的抽取 基于机器学习的抽取
下载PDF
外部注意力增强语义交互的阅读理解模型
6
作者 吴迪 马超 段晓旋 《计算机工程与设计》 北大核心 2024年第7期2097-2103,共7页
针对传统抽取式阅读理解模型未充分考虑问答样本之间潜在相关性的问题,通过RoBERTa对问题与段落进行编码,利用外部注意力Exatt增强语义交互层特征获取能力,提出外部注意力增强语义交互的阅读理解模型,捕获问题与段落中蕴涵的语义特征和... 针对传统抽取式阅读理解模型未充分考虑问答样本之间潜在相关性的问题,通过RoBERTa对问题与段落进行编码,利用外部注意力Exatt增强语义交互层特征获取能力,提出外部注意力增强语义交互的阅读理解模型,捕获问题与段落中蕴涵的语义特征和不同问答样本之间的潜在相关性。实验结果表明,在CMRC2018和构建的电力安规问答数据集上,在评价指标EM和F1两方面,该方法较基线模型分别最高提高了0.737%和2.556%。 展开更多
关键词 电力安规 抽取机器阅读理解 预训练模型 问答样本 潜在相关性 外部注意力 语义交互
下载PDF
关于出入境检验检疫关联危害因子自动侦搜与处理技术的研究
7
作者 朱跃林 朱万颖 孙兰 《电子技术与软件工程》 2014年第12期208-209,共2页
面对我国持续增长的超大规模出入境活动活动态势,境内外的危害源(疫情疫病、有害物质、恐怖因子等)和突发及孕育的危害事件对巨量进出境对象造成的威胁。本文基于出入境检验检疫的专业知识技术,采用自然语言处理、信息抽取、机器学习和... 面对我国持续增长的超大规模出入境活动活动态势,境内外的危害源(疫情疫病、有害物质、恐怖因子等)和突发及孕育的危害事件对巨量进出境对象造成的威胁。本文基于出入境检验检疫的专业知识技术,采用自然语言处理、信息抽取、机器学习和文本挖掘等技术,建立在网络环境条件下的出入境检验检疫关联危害因子信息的自动侦搜与处理系统。该系统能实时捕获全球危害事件发生情况,并对其进行自动侦搜和分析处理,将各种异构信息集成为格式化的可供用户理解的知识,有效支持检验检疫人员对境内外突发或正在接近临界发生的危害事件实施早期预警报道和快速反映,最大程度的保护国家卫生安全、保证国家进出口产品的品质。 展开更多
关键词 自然语言处理 信息抽取机器抽取 文本挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部