-
题名基于平衡损失和多级注意力的溯因推理方法
- 1
-
-
作者
李林昊
王澳
孙树国
吕欢
徐铭
王振
-
机构
河北工业大学人工智能与数据科学学院
河北省大数据计算重点实验室(河北工业大学)
河北省数据驱动工业智能工程研究中心(河北工业大学)
天津国通物联技术有限公司
-
出处
《闽南师范大学学报(自然科学版)》
2024年第1期27-39,共13页
-
基金
国家青年基金(62306103)
河北省自然科学基金(F2020202028)。
-
文摘
针对溯因自然语言推理任务(aNLI)中存在的问题,即正确假设之间存在一定独立性,且对推理的贡献存在不一致性,设计一种“平衡正样本softmax聚焦损失”,调整正确假设概率影响程度,并平衡样本损失权重.此外,在aNLI中,正样本与负样本之间的关联性往往体现在特定的短语上,这些短语对判断样本的合理性至关重要.因此设计多级注意力模型,通过多层次的注意力机制逐步细化,从而实现对短语级特征的深层次关注.这个新模型被命名为平衡损失多级注意力MAT-Ball模型.结果表明,MAT-Ball模型在Roberta-large预训练模型上取得了最高的性能,与公开可获得代码的方法相比,ACC和AUC结果分别增加了约1%和0.5%.同时,研究比较了在低资源和损失收敛性方面的性能,证明了所提出的方法的效率和鲁棒性.
-
关键词
自然语言推理
溯因推理
预训练模型
注意力机制
-
Keywords
natural language reasoning
abductive reasoning
pre-training model
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-