-
题名显式融合词法和句法特征的抽取式机器阅读理解模型
- 1
-
-
作者
闫维宏
李少博
单丽莉
孙承杰
刘秉权
-
机构
人民网传播内容认知国家重点实验室
哈尔滨工业大学计算学部
-
出处
《计算机系统应用》
2022年第9期352-359,共8页
-
基金
国家自然科学基金(62176074)。
-
文摘
预训练语言模型虽然能够为每个词提供优良的上下文表示特征,但却无法显式地给出词法和句法特征,而这些特征往往是理解整体语义的基础.鉴于此,本文通过显式地引入词法和句法特征,探究其对于预训练模型阅读理解能力的影响.首先,本文选用了词性标注和命名实体识别来提供词法特征,使用依存分析来提供句法特征,将二者与预训练模型输出的上下文表示相融合.随后,我们设计了基于注意力机制的自适应特征融合方法来融合不同类型特征.在抽取式机器阅读理解数据集CMRC2018上的实验表明,本文方法以极低的算力成本,利用显式引入的词法和句法等语言特征帮助模型在F和EM指标上分别取得0.37%和1.56%的提升.
-
关键词
机器阅读理解
词法特征
句法特征
深度学习
预训练模型
特征融合
注意力机制
-
Keywords
machine reading comprehension
lexical features
syntactic features
deep learning
pre-trained models
feature fusion
attention mechanism
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-