融入注意力机制的越南语组块识别方法被引量：1

Vietnamese Chunk Identification Incorporating Attention Mechanism

下载PDF

导出

摘要对于越南语组块识别任务,在前期对越南语组块内部词性构成模式进行统计调查的基础上,该文针对Bi-LSTM+CRF模型提出了两种融入注意力机制的方法:一是在输入层融入注意力机制,从而使得模型能够灵活调整输入的词向量与词性特征向量各自的权重;二是在Bi-LSTM之上加入了多头注意力机制,从而使模型能够学习到Bi-LSTM输出值的权重矩阵,进而有选择地聚焦于重要信息。实验结果表明,在输入层融入注意力机制后,模型对组块识别的F值提升了3.08%,在Bi-LSTM之上加入了多头注意力机制之后,模型对组块识别的F值提升了4.56%,证明了这两种方法的有效性。 For the Vietnamese chunk identification task,this paper proposes two ways to integrate the attention mechanism with the Bi-LSTM+CRF model.The first is to integrate the attention mechanism at the input layer,which allows the model to flexibly adjust weights of word embeddings and POS feature embeddings.The second is to add a multi-head attention mechanism on the top of Bi-LSTM,which enables the model to learn weight matrix of the Bi-LSTM outputs and selectively focus on important information.Experimental results show that,after integrating the attention mechanism at the input layer,the F-value of Vietnamese chunk identification is increased by 3.08%;and after adding the multi-head attention mechanism on the top of Bi-LSTM,the F-value of Vietnamese chunk identification is improved by 4.56%.

作者王闻慧毕玉德雷树杰 WANG Wenhui;BI Yude;LEI Shujie(Luoyang Division,Information Engineering University,Luoyang,Henan 471003,China;College of For&gn Language and Literature,Fudan University,Shanghai 200433,China)

机构地区信息工程大学洛阳校区复旦大学外国语言文学学院

出处《中文信息学报》 CSCD 北大核心 2019年第12期91-100,共10页 Journal of Chinese Information Processing

关键词越南语组块识别 Bi-LSTM+CRF模型注意力机制 Vietnamese chunk identification Bi-LSTM+CRF model attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1张昱琪,周强.汉语基本短语的自动识别[J].中文信息学报,2002,16(6):1-8. 被引量：41
2李珩,朱靖波,姚天顺.基于SVM的中文组块分析[J].中文信息学报,2004,18(2):1-7. 被引量：50
3徐中一,胡谦,刘磊.基于CRF的中文组块分析[J].吉林大学学报（理学版）,2007,45(3):416-420. 被引量：7
4刘芳,赵铁军,于浩,杨沐昀,方高林.基于统计的汉语组块分析[J].中文信息学报,2000,14(6):28-32. 被引量：27
5张芬,曲维光,赵红艳,周俊生.基于CRF和转换错误驱动学习的浅层句法分析[J].广西师范大学学报（自然科学版）,2011,29(3):147-150. 被引量：1
6王路路,艾山.吾买尔,吐尔根.依布拉音,买合木提.买买提,卡哈尔江.阿比的热西提.基于深度神经网络的维吾尔文命名实体识别研究[J].中文信息学报,2019,33(3):64-70. 被引量：10

二级参考文献30

1黄德根,王莹莹.基于SVM的组块识别及其错误驱动学习方法[J].中文信息学报,2006,20(6):17-24. 被引量：6
2周强.汉语语料库的短语自动划分和标注研究.北京大学博士研究生学位论文[M].-,1996..
3赵军.汉语基本名词短语识别及结构分析研究.清华大学工学博士学位论文[M].-,1998..
4孙宏林.现代汉语非受限文本的实语块分析.北京大学博士研究生学位论文[M].-,2001..
5KUDOH T,MATSUMOTO Y. Chunking with support vector machines[C]//Proceedings of the Second Meeting of the North American Chapter of the Association for Computational Linguistics on Language Technologies. Stroudsburg, PA: Association for Computational Linguistics, 2001 : 1-8.
6LAFFERTY J D,McCALLUM A ,PEREIRA F C N. Conditional random fields:probabilistic models for segmenting and labeling sequence data [C]//Proceedings of the Eighteenth International Conference on Machine Learning. San Francisco, CA: Morgan Kaufmann Publishers Inc, 2001 : 282-289.
7STEVEN A. Partial parsing via finite-state cascades [J]. Natural Language Engineering, 1996,2(4):337-344.
8SANG E F T K,BUCHHOLZ S. Introduction to the CoNLL-2000 shared task :chunking[C]//Proceedings of the 2nd Workshop on Learning Language in Logic and the 4th Conference on Computational Natural Language Learning:vol 7. Stroudsburg ,PA : Association for Computational Linguistics, 2000: 127-132.
9BRILL E. Transformation-based error-driven learning and natural language processing:a case study in part-of-speech tagging[J]. Computational Linguistics, 1995,21 (4) : 543-565.
10SANG E F T K,VEENSTRA J. Representing text ehunks[C]//Proceedings of the Ninth Conference on European Chapter of the Association for Computational Linguistics. Stroudsburg,PA:Association for Computational Linguistics, 1999.. 173-179.

共引文献103

1李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：19
2谭咏梅,姚天顺,陈晴,李珩,朱靖波.基于SVM+Sigmoid的汉语组块识别[J].计算机科学,2004,31(8):142-146. 被引量：3
3陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
4曹建芳,郑家恒.基于SVM的汉语动词短语识别[J].咸阳师范学院学报,2004,19(6):32-34. 被引量：3
5干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
6华沙宝,达胡白乙拉.对蒙古语语料库基本名词短语的定界与统计分析[J].中文信息学报,2005,19(5):52-58. 被引量：4
7顾晓明,翟玉庆.一种基于本体的军用文书理解系统设计[J].现代计算机,2006,12(3):69-72. 被引量：2
8李玉鑑.英汉翻译模板的标准化方案及其应用[J].中文信息学报,2006,20(B03):41-46.
9林煜明,李优.基于SVM的句子组块识别[J].山东大学学报（理学版）,2006,41(3):33-36.
10吕德新,张桂平,蔡东风,余超.基于语义信息的问题分类[J].沈阳航空工业学院学报,2006,23(3):38-40. 被引量：1

同被引文献5

1王衡军,司念文,宋玉龙,单义栋.结合全局向量特征的神经网络依存句法分析模型[J].通信学报,2018,39(2):53-64. 被引量：3
2陈伟,吴友政,陈文亮,张民.基于BiLSTM-CRF的关键词自动抽取[J].计算机科学,2018,45(B06):91-96. 被引量：29
3谌志群,鞠婷,王冰.结合树形概率和双向长短期记忆的渐步性句法分析方法[J].厦门大学学报（自然科学版）,2019,58(2):243-248. 被引量：3
4袁源,何云琪,钱龙华.基于深度学习的疾病命名实体识别[J].福建电脑,2019,35(3):39-42. 被引量：1
5谷波,王瑞波,李济洪,李国臣.基于RNN的中文二分结构句法分析[J].中文信息学报,2019,33(1):35-45. 被引量：15

引证文献1

1杨陈菊,邵玉斌,孙俊,龙华,皮乾东.结合BiLSTM+CRF和TextRank的句法边界分析[J].小型微型计算机系统,2022,43(7):1394-1400.

1翁剑帆.论海籍测量的几种方法[J].建材发展导向,2020,18(2):119-119.
2李文香.微课走进初中政治课堂的策略[J].科学咨询,2019,0(28):70-70.
3熊文娟,沈绍武,肖勇,徐国栋.中医医疗管理统计调查制度实践及思考[J].中国医院,2020,24(1):76-78. 被引量：2
4韩顺法,苏佳.中国文化艺术类企业智库的发展特征及提升策略[J].智库理论与实践,2020,5(1):28-34.
5党惠雯.新形势下对环境统计工作的思考[J].科技创新导报,2019,16(28):124-124. 被引量：2
6吴兵,张艺曦.虚拟现实技术在艺术设计实践教学改革中的应用[J].长江丛刊,2019,0(30):19-20. 被引量：1
7陈伟华.张恨水《啼笑因缘》与20世纪30年代武侠电影叙事模式的嬗变[J].高等学校文科学术文摘,2019,36(6):221-221.
8朱元,张九根,卢佳乐,陈鑫.基于异构信息网络的模糊贴近度推荐算法[J].计算机工程与设计,2020,41(2):367-372. 被引量：5
9纪仁伟.培养学生职业技能目标下的中职田径教学创新策略[J].体育风尚,2019,0(12):95-96. 被引量：1
10Jessie(文/图).眼见不为“实”[J].科学大众（中学生）,2019,0(12):49-51.

中文信息学报

2019年第12期

浏览历史

内容加载中请稍等...

融入注意力机制的越南语组块识别方法被引量：1

参考文献6

二级参考文献30

共引文献103

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

融入注意力机制的越南语组块识别方法 被引量：1

参考文献6

二级参考文献30

共引文献103

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

融入注意力机制的越南语组块识别方法被引量：1