-
题名面向小样本抽取式问答的多标签语义校准方法
- 1
-
-
作者
刘青
陈艳平
邹安琪
秦永彬
黄瑞章
-
机构
贵州大学公共大数据国家重点实验室
贵州大学文本计算与认知智能教育部工程研究中心
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2024年第1期161-173,共13页
-
基金
国家自然科学基金(No.62166007)资助。
-
文摘
小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同层级的语义提出了一种面向小样本抽取式问答任务的多标签语义校准方法。采用包含全局语义信息的头标签和基线模型中的特殊字符构成多标签进行语义融合,并利用语义融合门来控制全局信息流的引入,将全局语义信息融合到特殊字符的语义信息中。然后,利用语义筛选门对新融入的全局语义信息和该特殊字符的原有语义信息进行保留与更替,实现对标签偏差语义的校准。在8个小样本抽取式问答数据集中的56组实验结果表明:该方法在评价指标F1值上均明显优于基线模型,证明了所提方法的有效性和先进性。
-
关键词
小样本抽取式问答
跨度抽取式问答
多标签语义融合
双门控机制
机器阅读理解
-
Keywords
few-shot extraction question answering
span extraction question answering
multi-label semantic fusion
dual gating mechanism
machine reading comprehension
-
分类号
P751.1
[交通运输工程—港口、海岸及近海工程]
-