融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注被引量：4

The Integration of Gated Filtering Mechanism and Deep Bi-LSTM-CRF for Chinese Semantic Role Labeling

下载PDF

导出

摘要语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究者将基于双向长短时记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)神经网络模型用于语义角色标注。该模型可以自动学习特征,并对词与词之间的远距离依赖关系进行有效建模。本文提出融合Bi-LSTM-CRF模型与依存句法特征的方法,并且引入Gate过滤机制对词向量表示进行调整,以达到利用句法特征提高语义角色标注精度的同时,规避特征工程的繁琐。CPB上的实验结果表明,利用本文所提方法的汉语语义角色标注的F1值达到79.53%,比前人的方法有了较为显著的提升。 The traditional statistical methods which based on the syntactic features algorithm were frequently used for the Chinese semantic role labeling. Since the dependency parsing provides semantic relations between words, better performances in semantic role labeling were achieved. However, hand-crafted feature extraction process was complicated in such methods and it is difficult to capture the long range dependences in a sentence. With the development of deep learning, researchers have applied the bidirectional long short-term memory （Bi-LSTM） model to semantic role labeling, which is capable of learning features automatically and capturing long-range dependence. This paper proposed a method of combining model （Bi-LSTM） with dependency structure and introduced a Gated filtering mechanism （GFM） to adjust the word representation. Experimental results on CPB showed that the proposed method achieved 79.53% of F1 in Chinese semantic role labeling and significantly outperformed the previous work.

作者张苗苗刘明童张玉洁徐金安陈钰枫 ZHANG Miaomiao;LIU Mingtong;ZHANG Yujie;XU Jinan;CHEN Yufeng(The School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China)

机构地区北京交通大学计算机与信息技术学院

出处《情报工程》 2018年第2期45-53,共9页 Technology Intelligence Engineering

基金北京交通大学人才基金(KKRC11001532) 国家自然科学基金(61370130 61473294) 北京市自然科学基金(4172047)

关键词汉语语义角色标注 Gate过滤机制 Bi-LSTM-CRF 依存句法分析 Chinese semantic role labeling gated filtering mechanism Bi-LSTM-CRF dependency parsing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009,35(15):82-84. 被引量：4
2王步康,王红玲,袁晓虹,周国栋.基于依存句法分析的中文语义角色标注[J].中文信息学报,2010,24(1):25-29. 被引量：23
3王鑫,穗志方.基于依存树距离识别论元的语义角色标注系统[J].中文信息学报,2012,26(2):40-45. 被引量：5
4王臻,常宝宝,穗志方.基于分层输出神经网络的汉语语义角色标注[J].中文信息学报,2014,28(6):56-61. 被引量：13
5王瑞波,李济洪,李国臣,杨耀文.基于Dropout正则化的汉语框架语义角色识别[J].中文信息学报,2017,31(1):147-154. 被引量：16

二级参考文献45

1周国光.汉语配价语法论略[J].南京师大学报（社会科学版）,1994(4):103-106. 被引量：30
2刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
3Gildea D,Jurafsky D.Automatic Labeling of Semantic Roles[J].Computational Linguistics,2002,28(3):245-288.
4Surdeanu M,Harabagiu S,Williams J,et al.Using Predicate-argument Structures for Information Extraction[C]//Proc.of the 41st Annual Meeting of the Association for Computational Linguistics.Tokyo,Japan:[s.n.],2003.
5Xue Nianwen,Palmer M.Calibrating Features for Semantic Role Labeling[C]//Proc.of the Conference on Empirical Methods in Natural Language Processing.Barcelona,Spain:[s.n.],2004.
6Pradhan S,Ward W,Hacioglu K,et al.Shallow Semantic Parsing Using Support Vector Machines[C]//Proc.of NAACL-HLT'04.Boston,Mass,USA:[s.n.],2004.
7CoNLL 2008, http://www. yr-bcn. es/conll2008/,[EB].
8CoNLL 2009, http://ufal. mff. cuni. cz/conll2009-st/, [EB].
9Kadri Hacioglu. Semantic Role Labeling Using Dependency Trees [C]//Proc. of CoNLL-2004, Boston, MA,US,2004.
10Johansson R. and Nugues P.. Dependency-based semantic role labeling of PropBank[C]//Proceedings of EMNLP-2008. 2008.

共引文献49

1曾凡超,叶娜,张桂平.汉语动词框架库的自动构建技术研究[J].沈阳航空航天大学学报,2011,28(5):63-66.
2裴颂文,王文浩,马超,吴百锋.一种面向流处理器的条件随机场并行计算方法[J].小型微型计算机系统,2011,32(12):2392-2395.
3王步康,王红玲,周国栋.基于树核函数的中文语义角色标注[J].计算机工程,2011,37(22):128-130. 被引量：2
4徐靖,李军辉,朱巧明,李培峰.基于短语和依存句法结构的中文语义角色标注[J].计算机工程,2011,37(24):169-172. 被引量：4
5王鑫,穗志方.基于依存树距离识别论元的语义角色标注系统[J].中文信息学报,2012,26(2):40-45. 被引量：5
6袁里驰.基于配价结构的词汇化句法分析模型[J].中南大学学报（自然科学版）,2012,43(5):1808-1813. 被引量：2
7袁里驰.融合语言知识的统计句法分析[J].中南大学学报（自然科学版）,2012,43(3):986-991. 被引量：5
8陈菜芳.中文语义角色标注研究概述[J].文教资料,2012(27):139-141. 被引量：1
9王智强,李茹,阴志洲,刘海静,李双红.基于依存特征的汉语框架语义角色自动标注[J].中文信息学报,2013,27(2):34-40. 被引量：8
10刘运通,梁燕军.自然语言语义相关度计算模型的k枝剪求解法[J].计算机工程与设计,2013,34(8):2939-2943. 被引量：7

同被引文献29

1刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
2于江德,樊孝忠,庞文博,余正涛.Semantic role labeling based on conditional random fields[J].Journal of Southeast University(English Edition),2007,23(3):361-364. 被引量：9
3汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009,35(15):82-84. 被引量：4
4邵艳秋,穗志方,吴云芳.基于词汇语义特征的中文语义角色标注研究[J].中文信息学报,2009,23(6):3-10. 被引量：7
5王步康,王红玲,袁晓虹,周国栋.基于依存句法分析的中文语义角色标注[J].中文信息学报,2010,24(1):25-29. 被引量：23
6于江德,王希杰,余正涛.基于最大熵模型的语义角色标注[J].微电子学与计算机,2010,27(8):173-176. 被引量：7
7毛小丽,何中市,邢欣来,刘莉.基于语义角色的实体关系抽取[J].计算机工程,2011,37(17):143-145. 被引量：7
8王步康,王红玲,周国栋.基于树核函数的中文语义角色标注[J].计算机工程,2011,37(22):128-130. 被引量：2
9王鑫,穗志方.基于依存树距离识别论元的语义角色标注系统[J].中文信息学报,2012,26(2):40-45. 被引量：5
10王荣洋,鞠久朋,李寿山,周国栋.基于CRFs的评价对象抽取特征研究[J].中文信息学报,2012,26(2):56-61. 被引量：38

引证文献4

1陈艳平,冯丽,秦永彬,黄瑞章.一种基于深度神经网络的句法要素识别方法[J].山东大学学报（工学版）,2020,50(2):44-49. 被引量：6
2徐建国,刘泳慧,刘梦凡.基于BILSTM-CRF的高校政策语义角色标注研究[J].计算机工程与应用,2021,57(6):207-211. 被引量：4
3朱傲,万福成,马宁,车郭怡.结合池化技术和特征组的汉语语义角色标注[J].云南大学学报（自然科学版）,2021,43(5):906-912. 被引量：2
4朱傲,万福成,马宁,车郭怡.结合注意力机制的多策略汉语语义角色标注[J].厦门大学学报（自然科学版）,2021,60(6):1019-1023. 被引量：1

二级引证文献13

1陈民,胡雪琼,鲁韦坤,周文文,陈亚平,李晓君,曹志勇.人工神经网络在农业病害预测中的应用[J].现代农业科技,2020(21):136-140. 被引量：5
2徐建国,刘泳慧,刘梦凡.基于BILSTM-CRF的高校政策语义角色标注研究[J].计算机工程与应用,2021,57(6):207-211. 被引量：4
3李洋,邢林林,蔡红珍,徐航,苏展鹏.基于对抗网络的农业生物质材料检测领域命名实体识别[J].农业与技术,2021,41(16):30-34.
4孙倩,秦永彬,黄瑞章,刘丽娟,陈艳平.结合案件要素序列的罪名预测方法[J].大数据,2021,7(6):30-40. 被引量：4
5袁里驰.利用深度神经网络并结合配价信息的语义角色标注[J].小型微型计算机系统,2022,43(9):1925-1930. 被引量：1
6张海航,陈进东,张健.基于BiLSTM-CRF的食品行业质量安全风险分析[J].系统科学与数学,2022,42(10):2616-2633. 被引量：2
7贾阵,丁泽华,陈艳平,黄瑞章,秦永彬.面向司法数据的事件抽取方法研究[J].计算机工程与应用,2023,59(6):277-282. 被引量：4
8班玛宝,色差甲,才让加,张瑞,柔特.一种端到端的藏文La格浅层语义分析[J].中文信息学报,2023,37(2):62-70.
9尚千壹,陈艳平,黄瑞章,秦永彬.基于回归的唯一谓语中心词识别[J].计算机工程与设计,2023,44(4):1213-1219. 被引量：1
10陈啸,陈建译,张浩骞.基于知识图谱的CTC系统故障诊断方法研究[J].铁道通信信号,2023,59(6):26-31. 被引量：2

1惠琰.陕北清涧方言“量度形容词”的句法特征[J].语言研究,2018,38(2):49-53. 被引量：1
2倪伟李.中秋月(组诗)[J].诗歌月刊,2018,0(5):62-64.
3李佳,范巍.基于改进D-S证据理论的网络入侵检测[J].控制工程,2017,24(11):2362-2367. 被引量：17
4王蕾,谢云,周俊生,顾彦慧,曲维光.基于神经网络的片段级中文命名实体识别[J].中文信息学报,2018,32(3):84-90. 被引量：20
5娜迪热,胡俊.基于用户社交网络数据的人格倾向性分析及预测模型的建立[J].电脑知识与技术,2018,14(3):6-11. 被引量：7
6Zhiqi Chen,Marcel C. Voia.Short-Term and Long-Term Margins of International Trade： Evidence from the Canada-Chile Free Trade Agreement[J].Frontiers of Economics in China-Selected Publications from Chinese Universities,2018,13(1):93-115. 被引量：1
7夏慧琼,樊丽芳,梅新.GIS专业学科竞赛背景下体验式学习活动设计[J].科技视界,2018(5):84-85.
8夏磊.基于行为识别匹配的用户日常运动检测[J].计算机测量与控制,2018,26(2):264-267. 被引量：2
9杜威,林浒,孙建伟,于波,姚恺丰.一种基于分层结构的音乐自动分类方法[J].小型微型计算机系统,2018,39(5):888-892. 被引量：7
10WAN Lili.Extraction Algorithm of English Text Summarization for English Teaching[J].International English Education Research,2018(1):27-30.

情报工程

2018年第2期

浏览历史

内容加载中请稍等...

融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注被引量：4

参考文献5

二级参考文献45

共引文献49

同被引文献29

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注 被引量：4

参考文献5

二级参考文献45

共引文献49

同被引文献29

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注被引量：4