-
题名基于对比学习与梯度惩罚的实体关系联合抽取模型
- 1
-
-
作者
张强
曾俊玮
陈锐
-
机构
东北石油大学计算机与信息技术学院
-
出处
《吉林大学学报(理学版)》
CAS
北大核心
2024年第5期1155-1162,共8页
-
基金
国家自然科学基金(批准号:42002138)
黑龙江省研究生课程思政建设项目(批准号:YJSKCSZ_202303)
黑龙江省优秀青年教师基础研究支持计划项目(批准号:YQJH2023073)。
-
文摘
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取.
-
关键词
实体关系抽取
对比学习
梯度惩罚
RoBERTa预训练模型
全局指针网络
-
Keywords
entity relation extraction
contrastive learning
gradient penalty
RoBERTa pre-trained model
global pointer network
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种结合关系增强融合模型的舆情关系抽取方法
- 2
-
-
作者
夏益昆
赵春一
-
机构
沈阳理工大学信息科学与工程学院
中国科学院沈阳计算技术研究所
-
出处
《软件导刊》
2024年第6期67-74,共8页
-
文摘
针对舆情信息关系种类繁多、状态空间巨大,以及舆情信息关系抽取任务中出现的关系重叠和单一模型不能完全识别出全部三元组的问题,提出一种结合关系增强的融合模型进行舆情关系抽取的方法。首先,对从中文互联网上获取的舆情信息进行初步处理,得到初步的关系表;其次,对获得的关系表引入实体类型进行关系表增强;最后,将增强关系表作为先验特征输入融合模型,提升关系分类准确性,结合两个模型的识别结果解决单一模型不能完全识别出全部三元组的问题。实验结果表明,该方法相较于单一未使用关系增强的模型,F1值提升了5.4%。
-
关键词
关系抽取
关系表增强
模型融合
全局指针网络
舆情分析
-
Keywords
relation extraction
relational schema enhancement
model fusion
global pointer network
public opinion analysis
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于知识增强的中文电子病历命名实体识别
- 3
-
-
作者
李宛泽
宋波
齐岳山
-
机构
青岛科技大学信息科学技术学院
-
出处
《计算机系统应用》
2023年第12期112-119,共8页
-
文摘
针对中文电子病历中医疗嵌套实体难以处理的问题,本文基于RoBERTa-wwm-ext-large预训练模型提出一种知识增强的中文电子病历命名实体识别模型ERBEGP.RoBERTa-wwm-ext-large采用的全词掩码策略能够获得词级别的语义表示,更适用于中文文本.首先结合知识图谱,使模型学习到了大量的医疗实体名词,进一步提高模型对电子病历实体识别的准确性.然后通过BiLSTM对电子病历输入序列编码,能够更好捕获病历的中上下语义信息.最后利用全局指针网络模型EGP(efficient GlobalPointer)同时考虑实体的头部和尾部的特征信息来预测嵌套实体,更加有效地解决中文电子病历命名实体识别任务中嵌套实体难以处理的问题.在CBLUE中的4个数据集上本文方法均取得了更好的识别效果,证明了ERBEGP模型的有效性.
-
关键词
中文电子病历
命名实体识别
知识增强
嵌套实体
全局指针网络模型
深度学习
-
Keywords
Chinese electronic medical records
named entity recognition(NER)
knowledge enhancement
nested entities
global pointer network model
deep learning
-
分类号
R-05
[医药卫生]
TP391.1
[自动化与计算机技术—计算机应用技术]
-