基于多粒度双向注意力机制的词义消歧深度学习方法

DEEP LEARNING METHOD FOR WORD SENSE DISAMBIGUATION BASED ON MULTI-GRANULARITY BI-DIRECTIONAL ATTENTION

下载PDF

导出

摘要词义消歧的目标是在特定的上下文中识别歧义词的正确词义。传统的监督方法主要是利用上下文的数据,而忽略了丰富的词义定义等词汇资源。最近的研究发现将词义定义整合到神经网络对于词义消歧具有显著的改进效果。提出引入词义定义的基于多粒度双向注意力机制的词义消歧模型,该模型采用字符级、词级和上下文嵌入的表示,使用双向注意力机制获取上下文和词义定义之间的交互关系,消融实验验证了模型中每个组成的重要性。实验结果表明,这种建模方式可以有效地识别歧义词的正确词义,在SemEval-13-task#12和SemEval-15-task#13公开数据集上进行了测试,F1值分别可达到68.9%和73.1%。 The goal of word sense disambiguation is to identify the correct meaning of an ambiguous word in particular context.Traditional supervised methods mainly rely on massive context data,ignoring lexical resources like rich sense definitions.Recent studies have shown that incorporating sense definitions into neural networks for word sense disambiguation has made significant improvement.This paper proposes a word sense disambiguation model that integrates senses definitions with multi-granularity bi-directional attention.It used character-level,word-level,and context embedding representations,and used bi-directional attention to obtain the interaction between the context and sense definitions.The ablation study verified the importance of each component in the model.The experiment results show that the modeling method can effectively distinguish the correct word meanings of the disambiguation words,and the accuracy can reach 68.7%and 73.1%respectively when tested on the public data sets of the semeval-13-task#12 and the semeval-15-task#13.

作者初钰凤张俊赵丽华 Chu Yufeng;Zhang Jun;Zhao Lihua(College of Information Science and Technology,Dalian Maritime University,Dalian 116026,Liaoning,China)

机构地区大连海事大学信息科学与技术学院

出处《计算机应用与软件》北大核心 2022年第11期194-200,共7页 Computer Applications and Software

关键词词义定义词义消歧双向注意力 Sense definitions Word sense disambiguation Bi-directional attention

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量：28

二级参考文献61

1宋余庆,罗永刚,孙志挥.应用主分量分析与粗糙集处理的特征提取[J].计算机工程与应用,2004,40(22):48-50. 被引量：7
2卢志茂,刘挺,郎君,李生.神经网络和贝叶斯网络在汉语词义消歧上的对比研究[J].高技术通讯,2004,14(8):15-19. 被引量：9
3黄昌宁,李涓子.词义排歧的一种语言模型[J].语言文字应用,2000(3):85-90. 被引量：16
4陈彬,洪家荣,王亚东.最优特征子集选择问题[J].计算机学报,1997,20(2):133-138. 被引量：96
5Nancy Ide and Jean Véronis.Introduction to the special issue on word sense disambiguation:The state of the art[J].In Computational Linguistics,1998,24(1):1-40.
6H Schütze.Automatic word sense discrimination[J].Compu-tat ional Linguistics,1998,24(1):97-123.
7董振东.HowNet[DB/OL].http://www.keenage.com.2002.
8George A.Miller.(Ed.) WordNet:An on-line lexical database [J].International Journal of Lexicography,1990,3(4):235-312.
9W A Gale,K W Church,D Yarowsky.Using bilingual materials to develop word sense disambiguation methods[A].Proceedings of the Fourth International Conference on Theoretical and Methodological Issues in Machine Translation[C].Montréal,Canada,1992.101-112.
10David Yarowsky.Unsupervised word sense disambiguation rivaling supervised methods[A].In Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics[C].Cambridge,MA.1995.189-196.

共引文献27

1刘远超,王晓龙,徐志明,刘秉权.基于粗集理论的中文关键词短语构成规则挖掘[J].电子学报,2007,35(2):371-374. 被引量：17
2王博,杨沐昀,李生,赵铁军.中文全词消歧在机器翻译系统中的性能评测[J].自动化学报,2008,34(5):535-541. 被引量：6
3范冬梅,卢志茂,张汝波,潘树燊.基于信息增益改进贝叶斯模型的汉语词义消歧[J].电子与信息学报,2008,30(12):2926-2929. 被引量：8
4吴云芳.词义消歧研究:资源、方法与评测[J].当代语言学,2009,11(2):113-123. 被引量：9
5王瑞琴,孔繁胜.无监督词义消歧研究[J].软件学报,2009,20(8):2138-2152. 被引量：17
6刘磊,曹存根,张春霞,田国刚.概念空间中上下位关系的意义识别研究[J].计算机学报,2009,32(8):1651-1661. 被引量：14
7袁健,张劲松,马良.二次回溯中文分词方法[J].计算机应用研究,2009,26(9):3321-3323. 被引量：3
8刘商飞,张志祥.基于改进的Bayes判别法的中文多义词消歧[J].计算机与数字工程,2009,37(10):32-35. 被引量：3
9李旭,刘国华,张东明.一种改进的汉语全文无指导词义消歧方法[J].自动化学报,2010,36(1):184-187. 被引量：6
10雷雪梅,王大亮,田中贵秋,曾广平.基于深层特征抽取的日文词义消歧系统[J].北京科技大学学报,2010,32(2):263-269. 被引量：1

1马雨萌,黄金霞,王昉,芮啸.融合BERT与多尺度CNN的科技政策内容多标签分类研究[J].情报杂志,2022,41(11):157-163. 被引量：8
2张倩,高建瓴,丁容.基于特征融合的中文分词研究[J].智能计算机与应用,2022,12(10):57-61.
3李菲,曹阳,顾问.学生在线学习行为分类融合方法的研究与应用[J].电脑与电信,2022(8):27-31. 被引量：1
4邢义男,张娜娜.结合BERT与多尺度CNN的民事纠纷问句意图分类[J].计算机工程与应用,2022,58(23):205-213. 被引量：2
5张军,张丽,沈凡凡,谭海,何炎祥.RoBERTa融合BiLSTM及注意力机制的隐式情感分析[J].计算机工程与应用,2022,58(23):142-150. 被引量：13
6段佳佳.结合特征融合与分离的带钢表面缺陷检测方法[J].现代计算机,2022,28(18):1-8.
7姚蕾,蒋明峰,方贤,魏波,李杨.结合部首特征和BERT-Transformer-CRF的中文电子病历实体识别方法研究[J].软件工程,2022,25(12):30-36. 被引量：1
8陈继刚.融入领域信息的医疗领域命名实体识别研究[J].科学与信息化,2022(22):158-161.
9孟金旭,单鸿涛,万俊杰,贾仁祥.BSLA:改进Siamese-LSTM的文本相似模型[J].计算机工程与应用,2022,58(23):178-185. 被引量：4
10石磊,王明宇,宋哲理,陶永才,卫琳,高宇飞,范雨欣.自注意力机制和BiGRU相结合的文本分类研究[J].小型微型计算机系统,2022,43(12):2541-2548. 被引量：3

计算机应用与软件

2022年第11期

浏览历史

内容加载中请稍等...

基于多粒度双向注意力机制的词义消歧深度学习方法

参考文献1

二级参考文献61

共引文献27

相关作者

相关机构

相关主题

浏览历史