-
题名基于EMD_ProtoNet的小样本关系抽取
- 1
-
-
作者
马怡琳
杨占力
吴峰
王利琴
-
机构
河北工业大学人工智能与数据科学学院
河北工业大学机械工程学院
河北省科学技术情报研究院
-
出处
《计算机仿真》
北大核心
2022年第11期318-322,共5页
-
基金
国家自然科学基金资助项目(61806072)
天津市自然科学基金资助项目(19JCZDJC40000)。
-
文摘
针对现有小样本关系抽取模型样本嵌入包含的信息量少、参考大量无关的特征,关系抽取效果不佳的问题,提出了EMD_ProtoNet模型。利用BERT进行样本嵌入,采用原型网络(Prototypical Networks,ProtoNet)为各个关系类别计算类原型,使用土方移动距离(Earth Mover's Distance,EMD)作为距离度量在匹配代价最小的样本嵌入之间生成最优匹配,通过计算BERT样本嵌入之间的距离确定样本的相关性,根据相关性进行抽取。采用一种交叉参照机制生成EMD公式中节点的重要性权重,从而更多地关注具有较大区别性的特征。实验结果表明,EMD_ProtoNet能够有效的表示样本嵌入并且有效的度量距离,具有更高的准确率和更快的收敛速度,适用于小样本关系抽取任务。
-
关键词
关系抽取
原型网络
交叉参照机制
-
Keywords
Relation extraction
Prototypical networks
Cross-reference mechanism
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-