题名 基于BERT和图注意力网络的篇章级事件论元识别
1
作者
王凯
廖涛
机构
安徽理工大学计算机科学与工程学院
出处
《现代计算机》
2024年第6期14-19,64,共7页
基金
国家自然科学基金面上项目(62076006)
安徽省高等学校自然研究基金资助项目(KJ2016A202)
安徽省高校优秀青年人才支持计划项目(gxyq2017007)。
文摘
事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法对噪声问题处理不佳。针对该问题,提出了一个基于BERT和图注意力网络的篇章级事件论元识别模型。该模型从两个角度去解决噪声问题,一方面,通过获取充分的篇章语义特征作为辅助,去构建更有效的篇章依存句法特征;另一方面,采用图注意力网络对不同的论元节点分配不同的权重,从而去除掉无效的论元。在RAMS语料库上的实验结果表明,该方法有效解决了篇章依存句法关系中存在的噪声问题,取得了较好的篇章级事件论元识别结果。
关键词
篇章级事件论元识别
依存句法关系
BERT
图注意力网络
Keywords
document level event argument recognition
dependency syntactic relation
BERT
graph attention network
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 中文突发事件论元识别方法研究
2
作者
李明亮
王勇
王瑛
机构
广东工业大学计算机学院
出处
《计算机科学与应用》
2022年第2期405-411,共7页
文摘
事件抽取是从非结构化的文本中抽取用户感兴趣的事件信息,并以结构化的形式展现。当前社交媒体快速发展,互联网上突发事件信息数量也剧增。如何准确地从大量无结构事件信息中识别并抽取出突发事件信息,分析突发事件舆情趋势对社会安全极为重要。本文利用双向长短期记忆神经网络(BiLSTM)与图注意力机制(GAT)获取事件句子中的句法信息和获得事件论元之间的内在关联,进一步提升事件论元识别的准确率。通过在真实数据集中多次实验证明,本文中的方法在公开的数据集上进行验证,与以往的事件论元识别方法相比获得较大的性能提升。
关键词
事件论元识别
双向长短期记忆神经网络
图注意力机制
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 语义角色标注中有效的识别论元算法研究
被引量:2
3
作者
丁金涛
周国栋
王红玲
朱巧明
机构
苏州大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第18期153-156,共4页
基金
国家高技术研究发展计划(863)(the National High-Tech Research and Development Plan of China under Grant No.2006AA01Z147)
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60673041)
高等院校博士学科点专项科研基金(the China Specialized Research Fund for the Doctoral Program of Higher Education under Grant No.20060285008)
文摘
语义角色标注中论元识别的结果对论元分类任务起着很重要的作用。以句法成分的中心词为依据,对论元识别算法进行研究,在训练集上识别出了98.78%的论元,在测试集识别出了97.17%的论元,并大大减少了不承担角色的训练样例。在此基础上以句法成分为标注单元,在自动句法分析上抽取和组合有用的特征,用支持向量机的方法进行学习分类,在测试集上获得77.84%的F1值。此结果是目前报告的基于单一句法分析的最好结果之一。
关键词
语义角色标注
论元识别
支持向量机
Keywords
semantic role labeling
argument identification
support vector machine
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于依存树距离识别论元的语义角色标注系统
被引量:5
4
作者
王鑫
穗志方
机构
北京大学计算语言学研究所
出处
《中文信息学报》
CSCD
北大核心
2012年第2期40-45,共6页
基金
国家自然科学基金资助项目(60873156
61075067)
国家社会科学基金资助项目(09BYY032)
文摘
在基于依存的语义角色标注研究中,大多数系统采用机器学习方法进行论元识别和分类。该文分析了依存树的特点,发现论元集中分布于依存树上的特定局部范围内,因此提出一种基于依存树距离的论元识别方法。该方法将候选论元限制在与目标动词的依存树距离不超过3的范围内,通过制订规则,提取目标动词的最佳候选论元集合。在CoNLL2009中文语料上采用正确的依存树,识别出了98.5%的论元。在此基础上,结合基于机器学习的角色分类,系统F值达到89.46%,比前人的方法 (81.68%)有了较为显著的提升。
关键词
论元识别
基于依存树距离的方法
语义角色标注
Keywords
argument identification
dependency tree distance based method
semantic role labeling
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于全局语义匹配的篇章级事件抽取方法
被引量:1
5
作者
高兵
皇甫楠
邹启杰
秦静
机构
大连大学信息工程学院
大连大学大连市智慧医疗与健康重点实验室
大连大学软件工程学院
出处
《计算机技术与发展》
2023年第7期154-159,共6页
基金
国家自然科学基金青年科学基金项目(62002038)
辽宁省科学研究经费项目(LJKZ1180)。
文摘
作为自然语言处理领域中经典的信息抽取任务,事件抽取方法可以帮助人们从海量文本数据中快速准确地获取结构化事件信息,在事理图谱构建、舆情监控、态势感知等多个方面都起着举足轻重的作用。而由于事件组成的复杂性,文档中会包含多个相关的事件句,如果在对文档进行事件抽取时仅针对单个句子,从句子层面进行事件抽取,则很难将一个事件分散在整个文档中的事件信息抽取完整,得到完整的事件信息。为了解决这些问题,该文提出了基于全局语义匹配的篇章级事件抽取方法。首先,使用基于长短期记忆网络—条件随机场的序列标注模型进行句子级事件抽取;其次,在句子级事件抽取的基础上,采用所提全局语义匹配方法进行事件共指判断,通过融合句子级事件信息完成事件信息的完整抽取;最后,在MUC-4事件抽取数据集对所提模型进行验证,结果表明所提方法对文档中分散的事件元素有更准确抽取效果,在F1值上也有明显提升。
关键词
事件抽取
篇章级事件抽取
全局语义匹配
论元识别
信息融合
机器学习
Keywords
event extraction
document level event extraction
global semantic match
argument identification
information fusion
machine learning
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于双流注意力机制的阅读理解式事件抽取模型
被引量:6
6
作者
安娜
白雄文
王红艳
张萌
机构
中国航天科工集团第二研究院七〇六所
出处
《计算机工程与设计》
北大核心
2022年第6期1686-1693,共8页
文摘
为解决事件论元识别任务中特征提取不充分、角色重叠及角色论元嵌套等问题,提出一种改进的模型。将机器阅读理解思想融入事件抽取模型,设计问题模板,以BERT预训练模型构建动态词向量表征,融合双流注意力机制提取的特征向量,基于多层指针网络完成事件论元识别,与事件类型检测结果合并作为事件抽取模型的输出。在数据集DuEE上的实验结果表明,该模型获得了较高的准确率、召回率和F1值,验证了改进模型的可行性。
关键词
事件抽取
双流注意力机制
阅读理解
多层指针网络
预训练模型
论元识别
多特征融合
Keywords
event extraction
two-stream self-attention mechanism
reading comprehension
multi-layer pointer network
pre-training model
argument recognition
multi feature fusion
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]