-
题名基于跨度回归的中文事件触发词抽取
被引量:3
- 1
-
-
作者
赵宇豪
陈艳平
黄瑞章
秦永彬
-
机构
贵州大学公共大数据国家重点实验室
贵州大学计算机科学与技术学院
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2023年第1期95-106,共12页
-
基金
国家自然科学基金(No.62166007)资助。
-
文摘
在中文事件触发词抽取任务中,基于词的模型会受到分词带来的错误,而基于字符的模型则难以捕获触发词的结构信息和上下文语义信息,为此提出了一种基于跨度回归的触发词抽取方法。该方法考虑到句子中特定长度的字符子序列(跨度)可能构成一个事件触发词,用基于Transformer的双向编码器的预训练语言模型获取句子的特征表示,进而生成触发词候选跨度;然后用一个分类器过滤低置信度的候选跨度,通过回归调整候选跨度的边界来准确定位触发词;最后对调整后的候选跨度进行分类得到抽取结果。在ACE2005中文数据集上的实验结果表明:基于跨度回归的方法对触发词识别任务的F1值为73.20%,对触发词分类任务的F1值为71.60%,优于现有模型;并与仅基于跨度的方法进行对比,验证了对跨度边界进行回归调整可以提高事件触发词检测的准确性。
-
关键词
事件抽取
事件触发词
基于Transformer的双向编码器
特征表示
跨度表示
回归调整
-
Keywords
event extraction
event trigger word
bidirectional encoder representation from Transformer(BERT)
feature representation
span representation
regression adjustment
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-