期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
多尺度核电质量文本故障信息语义抽取方法 被引量:1
1
作者 吴庭伟 王梦灵 +1 位作者 易树平 郭景任 《中国机械工程》 EI CAS CSCD 北大核心 2023年第8期976-981,992,共7页
提出了多尺度核电质量文本故障信息语义抽取方法,从核电质量文本描述中获取了存在质量缺陷的故障设备与所属阶段的信息。针对故障设备与正常设备并存,以及所属设计、采购、施工和调试的全价值链阶段未描述的问题,提出了多尺度故障信息... 提出了多尺度核电质量文本故障信息语义抽取方法,从核电质量文本描述中获取了存在质量缺陷的故障设备与所属阶段的信息。针对故障设备与正常设备并存,以及所属设计、采购、施工和调试的全价值链阶段未描述的问题,提出了多尺度故障信息抽取策略。基于Transformer双向编码的预训练语言模型将核电质量文本转化为文本向量;采用注意力机制的双向门控循环神经网络挖掘出质量缺陷的关键语义特征;采用条件随机场对关键语义特征进行实体预测,输出故障设备;通过多层感知机对提取的关键语义特征进行微调及推理,解译出故障设备所属阶段。最后,在真实的核电质量文本数据集上进行验证,F1值达到94.3%,表明提出的方法具有较好可行性和有效性。 展开更多
关键词 多尺度 核电质量文本 语义抽取 预训练语言模型 条件随机场
下载PDF
基于特定数学模型的语义抽取研究
2
作者 关丽红 《白城师范学院学报》 2012年第3期11-13,31,共4页
进入知识社会,大量芜杂的信息使得读者陷入了尴尬的境地,笔者针对此种情况,从数学的角度来进行特定模型的语义抽取研究,通过相似值的计算、过滤及最大墒值的自动提取等环节来为用户自动抽取简洁的信息需求内容,并设计出一套科学合理的... 进入知识社会,大量芜杂的信息使得读者陷入了尴尬的境地,笔者针对此种情况,从数学的角度来进行特定模型的语义抽取研究,通过相似值的计算、过滤及最大墒值的自动提取等环节来为用户自动抽取简洁的信息需求内容,并设计出一套科学合理的计算模式,以期对相关领域的理论研究及实践发展有所贡献. 展开更多
关键词 语义抽取 数学模型 领域本体
下载PDF
一种基于本体的异构数据语义抽取方法 被引量:2
3
作者 成欣 李扬 《计算机与现代化》 2014年第6期1-6,11,共7页
针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本... 针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本体;然后,通过异构数据间的关联映射,构建领域数据的全局本体,实现异构数据的有效组织与统一管理;最后,将相关方法应用到材料领域,为材料科学数据的有效管理与共享服务提供支撑。 展开更多
关键词 本体 异构数据 语义抽取 数据集成 领域科学数据
下载PDF
基于混合核方法的上下位语义抽取
4
作者 江泳 产文 +2 位作者 王金华 周向东 施伯乐 《计算机应用与软件》 CSCD 北大核心 2014年第4期45-47,93,共4页
上下位语义抽取对于知识库构建、信息检索、智能语音以及其他语义应用都具有重要意义。如何有效地描述语义对象的上下文相似度是语义抽取的关键。文本核方法能在更高的维度上比较文本的语义相似性,显示出良好的应用前景。但是,目前常用... 上下位语义抽取对于知识库构建、信息检索、智能语音以及其他语义应用都具有重要意义。如何有效地描述语义对象的上下文相似度是语义抽取的关键。文本核方法能在更高的维度上比较文本的语义相似性,显示出良好的应用前景。但是,目前常用的文本的语法解析树核以及文本序列核对子句长度较为敏感。提出一种新的混合文本核方法,在利用文本中词法和语法信息改进现有的解析树核和文本串核的基础上,对于句子长度具有自适应性。实验显示与已有核方法相比较,该方法取得了较好的效果,显著地提高了上下文语义抽取的准确率和召回率。 展开更多
关键词 语义抽取 解析树核 子串核 上下位语义 混合核
下载PDF
领域相关的数学文本语义抽取
5
作者 陈肖宇 王伟 《计算机应用》 CSCD 北大核心 2022年第8期2386-2393,共8页
针对科技领域文档语义信息获取不充分的问题,提出一套基于规则的数学领域相关文本的语义抽取方法。首先从文本中提取领域概念并实现数学实体与领域概念之间的语义映射;然后对数学符号的上下文进行分析,获取数学符号的实体指代或文字描述... 针对科技领域文档语义信息获取不充分的问题,提出一套基于规则的数学领域相关文本的语义抽取方法。首先从文本中提取领域概念并实现数学实体与领域概念之间的语义映射;然后对数学符号的上下文进行分析,获取数学符号的实体指代或文字描述,进而抽取其语义;最后基于已抽取的数学符号语义实现表达式的语义分析。以线性代数文本为研究实例,构建了一个语义标注数据集并进行实验,实验结果表明所提方法对标识符、线性代数实体以及表达式的语义抽取具有93%以上的精确率和91%以上的召回率。 展开更多
关键词 语义抽取 实体指代 上下文分析 数学语言处理 数学文本理解
下载PDF
基于特征关联的视频中群体人物行为语义抽取
6
作者 掌静 陈志 岳文静 《计算机技术与发展》 2020年第4期26-30,共5页
为解决视频中群体人物行为语义抽取中群体人物相互遮挡、追踪困难等问题,构建一种基于特征关联的视频中群体行为人物语义抽取算法。该算法首先对视频帧提取多尺度融合特征图,通过特征图检测视频帧中可能存在的人物,利用去重算法筛除检... 为解决视频中群体人物行为语义抽取中群体人物相互遮挡、追踪困难等问题,构建一种基于特征关联的视频中群体行为人物语义抽取算法。该算法首先对视频帧提取多尺度融合特征图,通过特征图检测视频帧中可能存在的人物,利用去重算法筛除检测到的重复人物,精准定位群体人物边界框;接着预测群体人物特征掩码,通过比对相邻视频帧人物特征掩码的差异度追踪群体人物的运动轨迹;最后结合群体人物的运动轨迹推理每帧视频帧的群体人物行为语义,根据群体人物行为特点抽取视频群体人物行为语义。实验结果表明,该算法能够准确提取、定位群体人物的动态线索,解决群体人物复杂时空关系导致的语义抽取低效问题,有效地提高群体人物语义抽取的准确率和鲁棒性。 展开更多
关键词 群体人物行为 语义抽取 目标检测 人物追踪 特征掩码 运动轨迹
下载PDF
基于数学模型的语义抽取构建探析
7
作者 邸东博 《科技情报开发与经济》 2012年第24期87-89,共3页
针对大量芜杂的信息使得读者陷入了尴尬境地的情况,从数学的角度进行了特定模型的语义抽取研究,并设计出一套科学合理的计算模式,以期对相关领域的理论研究及实践发展有所贡献。
关键词 语义抽取 数学模型 领域本体
下载PDF
融合实体注意力与语义信息的关系抽取模型
8
作者 刘云腾 《计算机与数字工程》 2024年第2期487-491,520,共6页
知识图谱通过语义网络,建立现实世界和数据世界映射,支撑了很多行业中的具体应用,实体关系抽取是知识图谱构建中的核心环节。论文针对关系抽取任务中实体相关特征利用率低、文本特征提取不充分以及部分预训练模型不能够很好提取序列特... 知识图谱通过语义网络,建立现实世界和数据世界映射,支撑了很多行业中的具体应用,实体关系抽取是知识图谱构建中的核心环节。论文针对关系抽取任务中实体相关特征利用率低、文本特征提取不充分以及部分预训练模型不能够很好提取序列特征的问题,提出一个基于BERT预训练模型,下游利用长短期记忆网络(LSTM)能够有效处理长期依赖问题的特点,再结合实体位置自感知注意力机制组合成新的模型。模型分别在两个公共数据集上测试,实验结果表明论文模型在TacRed数据集和SemEval 2020 Task 8数据集上f1得分值分别可以达到67.1%,87.8%,均优于部分先前的模型。 展开更多
关键词 预训练模型 语义关系抽取 注意力机制 长短期记忆网络 自然语言处理
下载PDF
DIKW价值链视角下档案文献资源知识元语义抽取与融合模型研究
9
作者 宋雪雁 张祥青 张伟民 《档案学研究》 北大核心 2023年第3期17-25,共9页
为促进档案文献资源智慧化开发与利用,本文解析了档案文献知识元语义抽取、语义融合与DIKW价值链的映射关系,探讨了档案文献知识元语义抽取、语义融合及其实现,并基于DIKW价值链构建了档案文献资源知识元语义抽取与融合模型。本研究对... 为促进档案文献资源智慧化开发与利用,本文解析了档案文献知识元语义抽取、语义融合与DIKW价值链的映射关系,探讨了档案文献知识元语义抽取、语义融合及其实现,并基于DIKW价值链构建了档案文献资源知识元语义抽取与融合模型。本研究对档案文献资源体系的知识化构建以及智慧服务具有参考价值。 展开更多
关键词 DIKW价值链 档案文献 知识元 知识语义抽取 知识语义融合
原文传递
基于艺术语义特征抽取的艺术档案信息聚合初探 被引量:2
10
作者 徐一男 李禾 《图书情报导刊》 2017年第4期52-56,共5页
由于数字艺术档案中信息语义形态多样、辨识度较低以及缺乏普适性的聚合策略,所以当前的艺术档案信息服务呈现零散、低效的状态。从数字艺术档案的艺术语义特征出发,以图像模型抽取、意象标签抽取作为切入点,探索了基于不同载体艺术信... 由于数字艺术档案中信息语义形态多样、辨识度较低以及缺乏普适性的聚合策略,所以当前的艺术档案信息服务呈现零散、低效的状态。从数字艺术档案的艺术语义特征出发,以图像模型抽取、意象标签抽取作为切入点,探索了基于不同载体艺术信息资源的抽取模式,从而提出了区别于纯文本抽取的艺术档案信息聚合途径和思路。 展开更多
关键词 数字艺术档案 艺术语义抽取 图像抽取模型 意象标签抽取
下载PDF
基于汉英双语语料的语义精准抽取系统设计
11
作者 周晓航 周晓宇 《现代电子技术》 北大核心 2020年第10期156-159,共4页
针对原有语义精准抽取系统抽取结果精度较差的问题,设计基于汉英双语语料的语义精准抽取系统。硬件部分沿用原有系统硬件部分,仅对语义信息录入设备与信息存储设备设计。软件部分设计,构建自动语义知识库,增加汉英双语语料信息;根据tf-... 针对原有语义精准抽取系统抽取结果精度较差的问题,设计基于汉英双语语料的语义精准抽取系统。硬件部分沿用原有系统硬件部分,仅对语义信息录入设备与信息存储设备设计。软件部分设计,构建自动语义知识库,增加汉英双语语料信息;根据tf-idf算法制定抽取规则;利用计算机编程语言控制抽取过程,实现精确抽取。至此,基于汉英双语语料的语义精准抽取系统设计完成。构建测试环境,完成性能测试,通过与原有系统对比可知,此系统抽取准确率与信息召回率远高于原有系统。由此可知,该系统抽取精度更高,更为有效。 展开更多
关键词 语义抽取 系统设计 双语语料 制定抽取规则 精准抽取 性能测试
下载PDF
基于合一句法和实体语义树的中文语义关系抽取 被引量:19
12
作者 虞欢欢 钱龙华 +1 位作者 周国栋 朱巧明 《中文信息学报》 CSCD 北大核心 2010年第5期17-23,共7页
该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高... 该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高中文语义关系抽取的性能。在ACE RDC 2005中文基准语料上进行的关系探测和关系抽取的实验表明,该方法能显著提高中文语义关系抽取性能,大类抽取的最佳F值达到67.0,这说明结构化句法信息和实体语义信息在中文语义关系抽取中具有互补性。 展开更多
关键词 中文语义关系抽取 卷积树核函数 实体语义信息
下载PDF
语言学组合特征在语义关系抽取中的应用 被引量:16
13
作者 奚斌 钱龙华 +2 位作者 周国栋 朱巧明 钱培德 《中文信息学报》 CSCD 北大核心 2008年第3期44-49,63,共7页
语义关系抽取是信息抽取中的一个重要的研究领域。目前基于特征向量的语义关系抽取已经很难通过发掘新的特征来提高抽取的性能。本文提出了一种特征组合方法,通过在各种词法、语法、语义的基本特征内部及特征之间进行合理的组合形成组... 语义关系抽取是信息抽取中的一个重要的研究领域。目前基于特征向量的语义关系抽取已经很难通过发掘新的特征来提高抽取的性能。本文提出了一种特征组合方法,通过在各种词法、语法、语义的基本特征内部及特征之间进行合理的组合形成组合特征,使用基于支持向量机的学习方法,使得关系抽取的准确率和召回率得到了提高。在ACE2004语料库的7个关系大类和23个关系子类抽取实验中F值分别达到了66.6%和59.50%。实验结果表明通过对基本语言学特征进行组合所得到的组合特征能够显著地提高语义关系抽取的性能。 展开更多
关键词 计算机应用 中文信息处理 语义关系抽取 支持向量机 组合特征
下载PDF
生物医学语义关系抽取方法综述 被引量:9
14
作者 李芳 刘胜宇 刘峥 《图书馆论坛》 CSSCI 北大核心 2017年第6期61-69,共9页
深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和... 深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融入到深度学习模型中,是进一步提升语义关系抽取效果的探索方向。 展开更多
关键词 语义关系抽取 生物医学 深度学习 卷积神经网络 自然语言处理
下载PDF
基于分层策略的弱指导语义关系抽取 被引量:1
15
作者 奚斌 周国栋 +1 位作者 钱龙华 潘珅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第1期178-181,共4页
提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用... 提出一种基于Bootstrapping的弱指导语义关系抽取方法。在初始训练集的选取中使用了分层选取策略。实验表明,初始训练数据集的选择对于弱指导语义关系抽取的性能影响较大,利用分层次选取策略选择的数据具有较高的代表性和均衡性,与使用随机选取的弱指导语义关系抽取相比,基于分层策略的弱指导语义关系抽取取得了更好的性能。 展开更多
关键词 弱指导 语义关系抽取 分层策略
下载PDF
网络音视频语义信息抽取系统
16
作者 李莲春 周金治 《计算机工程》 CAS CSCD 北大核心 2011年第13期269-271,共3页
针对海量网络数据的描述与管理问题,提出音视频语义信息抽取系统。根据网络音视频流数据包的特征,采用正则表达式制定协议包识别规则。在此基础上,通过分析音视频传输协议结构,提取音视频数据从网络接口层、网络层、传输层到应用层的多... 针对海量网络数据的描述与管理问题,提出音视频语义信息抽取系统。根据网络音视频流数据包的特征,采用正则表达式制定协议包识别规则。在此基础上,通过分析音视频传输协议结构,提取音视频数据从网络接口层、网络层、传输层到应用层的多层语义信息,并形成UCL标签。实验结果表明,在保证流完整性的前提下,该算法的召回率和准确率均达到80%以上。 展开更多
关键词 网络音视频数据 多层语义理解 语义抽取 正则表达式 UCL语义标签
下载PDF
语义关系抽取发展现状及抽取方法的研究 被引量:1
17
作者 黄晨 《福建电脑》 2009年第6期45-46,共2页
命名实体语义关系抽取是信息抽取中的主要任务之一,本文对现有的语义关系抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,回顾语义关系抽取研究的历史,总结语义关系抽取技术的现状,将有助语义关系抽取技术研究工作的... 命名实体语义关系抽取是信息抽取中的主要任务之一,本文对现有的语义关系抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,回顾语义关系抽取研究的历史,总结语义关系抽取技术的现状,将有助语义关系抽取技术研究工作的向前发展。 展开更多
关键词 信息抽取技术 信息抽取 实体 关系 语义关系抽取
下载PDF
基于词项聚类的文本语义标签抽取研究
18
作者 李雄 丁治明 +1 位作者 苏醒 郭黎敏 《计算机科学》 CSCD 北大核心 2018年第B11期417-421,438,共6页
本研究主要解决在大量文本数据中抽取关键语义信息的问题。文本是自然语言的信息载体,在分析和处理文本信息时,由于目标与方式不同,对文本信息的特征表达方式也各不相同。已有的语义抽取方法往往是针对单篇文本的,忽略了不同文本间的语... 本研究主要解决在大量文本数据中抽取关键语义信息的问题。文本是自然语言的信息载体,在分析和处理文本信息时,由于目标与方式不同,对文本信息的特征表达方式也各不相同。已有的语义抽取方法往往是针对单篇文本的,忽略了不同文本间的语义联系。为此,文中提出了基于词项聚类的文本语义标签提取方法。该方法以语义抽取为目标,以Hinton的分布式表示假说为文本信息的表达方式,并以最大化语义标签与原文本数据间的语义相似度为目标,使用聚类算法对语义标签进行聚类。实验表明,所提方法由于是基于全体词汇表对语义信息分布进行聚类计算的,因此在语义丰富度和表达能力上相比很多现有方法具有更好的表现。 展开更多
关键词 语义抽取 分布式表示假说 聚类 相似度
下载PDF
语言学特征在中文实体间语义关系抽取中的应用
19
作者 季元叶 《福建电脑》 2010年第6期78-79,共2页
实体间语义关系抽取是信息抽取中的重要环节,其目的是从文本中找出实体对之间的语义关系并对它们进行分类。本文主要通过发掘有效的词汇特征、实体特征、基本短语块特征等基本语言学特征,采用基于支持向量机的学习方法,来提高中文实体... 实体间语义关系抽取是信息抽取中的重要环节,其目的是从文本中找出实体对之间的语义关系并对它们进行分类。本文主要通过发掘有效的词汇特征、实体特征、基本短语块特征等基本语言学特征,采用基于支持向量机的学习方法,来提高中文实体间语义关系抽取的性能,使得关系抽取的准确率和召回率得到提高,最终提高关系探测、大类抽取和子类抽取的F值。 展开更多
关键词 信息抽取 语义关系抽取 支持向量机 语言学特征
下载PDF
基于语义特征抽取的文本聚类研究 被引量:3
20
作者 殷硕 王卫亚 柳有权 《计算机技术与发展》 2020年第3期46-50,共5页
基于向量空间模型(VSM)的文本聚类会出现向量维度过高以及缺乏语义信息的问题,导致聚类效果出现偏差。为解决以上问题,引入《知网》作为语义词典,并改进词语相似度算法的不足。利用改进的词语语义相似度算法对文本特征进行语义压缩,使... 基于向量空间模型(VSM)的文本聚类会出现向量维度过高以及缺乏语义信息的问题,导致聚类效果出现偏差。为解决以上问题,引入《知网》作为语义词典,并改进词语相似度算法的不足。利用改进的词语语义相似度算法对文本特征进行语义压缩,使所有特征词都是主题相关的,利用调整后的TF-IDF算法对特征项进行加权,完成文本特征抽取,降低文本表示模型的维度。在聚类中,将同一类的文本划分为同一个簇,利用簇中所有文本的特征词完成簇的语义特征抽取,簇的表示模型和文本的表示模型有着相同的形式。通过计算簇之间的语义相似度,将相似度大于阈值的簇合并,更新簇的特征,直到算法结束。通过实验验证,与基于K-Means和VSM的聚类算法相比,文中算法大幅降低了向量维度,聚类效果也有明显提升。 展开更多
关键词 文本聚类 语义特征抽取 特征降维 文本相似度 知网
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部