基于异构关系网络图的词义消歧研究被引量：11

WSD Method Based on Heterogeneous Relation Graph

下载PDF

导出

摘要传统的基于知识库的词义消歧方法采用同一种类型知识(语义或共现关系)进行消歧,忽略了不同类型知识之间的互补作用.针对此问题,在传统的网络图词义消歧模型基础上,通过模型重构和对比实验,提出了一种基于异构关系网络图的词义消歧模型.该模型能够把多种类型的词义消歧知识有机融合到同一个网络图中,充分利用了多种知识协同消歧的优势.同时设计并实现了一种基于模拟退火的自动估计各种知识类型关系权重的方法,以最优化各种知识对消歧效果的影响.该方法是一种无监督的词义消歧方法,可以有效克服数据稀疏及知识获取瓶颈等问题.在SemEval-2007上的测试结果表明,该方法的消歧性能优于基线方法和目前参加该项评测的最好系统. As one of the most important problems in natural language processing, word sense disambiguation （WSD） aims to identify the intended meaning （sense） of words in context. Traditional knowledge-based WSD methods usually leverage only one sort of knowledge （semantic or cooccurrence relationships） but ignore the complementarity between different types for disambiguation. To deal with this probIem, this paper proposes a novel WSD model using heterogeneous relation graph. Based on the reconstruction of traditional graph-based WSD model, different kinds of knowledge are naturally incorporated. Furthermore, since not all types of knowledge play an equally important role in WSD, an automatic parameter estimation method is designed and implemented to optimize the disambiguation effect by estimating the weight of various kinds of relations. The parameter estimation algorithm is adapted based on simulated annealing algorithm. The proposed WSD model is unsupervised. It can make full use of multi-source knowledge and alleviate the data sparseness and knowledge acquisition problems. The model is evaluated on a standard multilingual Chinese English lexical task （SemEval-2007）, and the results indicate that the proposed method could significantly outperform the baseline method. Moreover, the proposed model also performs better than the best participating system in the evaluation.

作者杨陟卓黄河燕

机构地区北京理工大学海量语言信息处理与云计算应用工程技术研究中心北京理工大学计算机学院

出处《计算机研究与发展》 EI CSCD 北大核心 2013年第2期437-444,共8页 Journal of Computer Research and Development

基金国家自然科学基金项目(61132009) 北京理工大学科技创新计划重大项目培育专项计划基金项目

关键词多类型知识异构关系网络图 PAGERANK 参数估计模拟退火 multi-source knowledge heterogeneous relation graph PageRank parameter estimation simulated annealing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘鹏远,赵铁军.基于双语词汇Web间接关联的无指导译文消歧[J].软件学报,2010,21(4):575-585. 被引量：6
2董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44. 被引量：57

二级参考文献7

1徐通锵.“字”和汉语语义句法的生成机制[J].语言文字应用,1999(1):24-34. 被引量：52
2董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：59
3陈群秀.一个在线义类词库:词网 WordNet[J].语言文字应用,1998(2):95-101. 被引量：31
4张普.中文信息处理专题研究主持人的话[J].语言文字应用,2000(2):40-41. 被引量：5
5Miller G. 1990,Word net:an online jexical database.InternationalJournal of Lexicography,Vol.3,No.4.
6董振东.机器翻译中词典和文法的关系[J].中文信息学报,1988,(3).
7刘鹏远,赵铁军,杨沐昀,李壮.基于等价伪译词模型的无指导译文消歧研究[J].电子与信息学报,2008,30(7):1690-1694. 被引量：3

共引文献61

1吴婷,李明扬,孔芳.基于同义推理的篇章级实体上下位关系语料库构建[J].中文信息学报,2020(4):38-46. 被引量：1
2李明琴,李涓子,王作英,陆大.中文语义依存关系分析的统计模型(英文)[J].计算机学报,2004,27(12):1679-1687. 被引量：9
3傅爱平.黏合式名词短语结构关系的考察和分析[J].中国语文,2004(6):508-520. 被引量：8
4安华林.现代汉语释义基元词探索[J].甘肃高师学报,2004,9(6):38-41.
5郑鑫,秦建军,陈汉辉,李伟宏.基于可拓学的自然语言处理与系统建模研究[J].哈尔滨工业大学学报,2006,38(7):1209-1212. 被引量：5
6耿增民,刘万春,朱玉文.受限领域的自动文摘方法研究[J].北京理工大学学报,2006,26(8):712-715. 被引量：1
7王奕首,滕弘飞,金博,屈福政.实现中小企业产品设计重用的若干途径[J].计算机工程与应用,2007,43(9):88-91. 被引量：1
8郎君,秦兵,刘挺,李正华,李生.中文人称名词短语单复数自动识别[J].自动化学报,2008,34(8):972-979. 被引量：4
9苏新春.《现代汉语语义分类词典》(TMC)研制中若干问题的思考[J].中文信息学报,2008,22(5):12-21. 被引量：18
10宋巍,秦兵,郎君,刘挺.句法与词义相结合的中文代词消解[J].中文信息学报,2008,22(6):8-13. 被引量：4

同被引文献85

1舒昝,张晓冉.面向异构类型的大数据查询优化研究[J].自动化与仪器仪表,2016(4):199-200. 被引量：4
2孔祥疆,马玉鹏,李英凡.异构数据库中的数据类型转换[J].计算机应用研究,2006,23(4):217-218. 被引量：8
3魏伟.汉语离合词研究综述[J].锦州医学院学报（社会科学版）,2006,4(4):80-83. 被引量：4
4董振东,董强.知网[EB/OL].[2013-02-11].http:∥www.keenage.conr/zhiwang/c-zhiwang.html,.
5NAVIGLI R. Word sense disambiguation: a survey [ J]. ACM Com- puting Surveys, 2009, 41(2) : 1 -69.
6CHAN Y S, NG H T. Scaling up word sense disambiguation via par- allel texts[ C]//AAAI 2005: Proceedings of the 20th National Con- ference on Artificial Intelligence. Menlo Park: AAAI Press, 2005, 3:1037 - 1042.
7PILEHVAR M T, JURGENS D, NAVIGLI R. Align, disambignate and walk: a unified approach for measuring semantic similarity [ C]//Proceedings of the 51 st Annual Meeting of the Association for Computational Linguistics. Stroudsburg: Association for Computa- tional Linguistics, 2013, 1:1341 - 1351.
8NAVIGLI R, PONZETTO S P. Joining forces pays off: Multilingnal joint word sense disambiguation[ C]// Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Stroudsburg: Asso- ciation for Computational Linguistics, 2012:1399 - 1410.
9STEVENSON M, AGIRRE E, SOROA A. Exploiting domain infor- mation for word sense disambiguation of medical documents[ J]. Journal of the American Medical Informatics Association, 2012, 19 (2) : 235 - 240.
10AGIRRE E, de LACALLE O L, SOROA A. Random walks for knowledge-based word sense disambiguation [ J ]. Computational Linguistics, 2014, 40(1): 57-84.

引证文献11

1杨威,杨陟卓.大学云架构与大数据处理建模研究[J].中国教育信息化（高教职教）,2015(1):16-18. 被引量：6
2杨陟卓.基于上下文语境的词义消歧方法[J].计算机应用,2015,35(4):1006-1008. 被引量：4
3闫蓉,高光来.上下文边界可变的词义消歧[J].计算机工程与设计,2015,36(10):2843-2848. 被引量：2
4张春祥,赵凌云,高雪瑶.基于卷积神经网络的词义消歧[J].北京邮电大学学报,2019,42(3):114-119. 被引量：3
5刘峤,钟云,李杨,刘瑶,秦志光.基于图的中文集成实体链接算法[J].计算机研究与发展,2016,53(2):270-283. 被引量：8
6张振景,李新福,田学东,王凯.基于SVM的离合词词义消歧[J].计算机科学,2016,43(2):239-244. 被引量：4
7李凤.试论面向异构类型的大数据查询优化措施[J].数码世界,2017,0(2):45-45.
8杨陟卓.基于上下文翻译的有监督词义消歧研究[J].计算机科学,2017,44(4):252-255. 被引量：11
9吴卫祖,刘利群,谢冬青.基于神经网络的异构网络向量化表示方法[J].计算机科学,2017,44(5):272-275. 被引量：2
10张春祥,周雪松,高雪瑶.一种循环神经网络的词义消歧方法[J].哈尔滨理工大学学报,2020,25(1):80-85. 被引量：1

二级引证文献42

1刘蓉蓉,司鹏博,陶启果.浅谈大数据在生产管理中的应用[J].印制电路信息,2021,29(S01):155-160.
2张亮亮,杨威,高立同.基于轻应用模式的CET报名系统设计与实现[J].中国教育信息化,2016,22(6):88-91.
3吴运兵,阴爱英,林开标,余小燕,赖国华.基于多数据源的知识图谱构建方法研究[J].福州大学学报（自然科学版）,2017,45(3):329-335. 被引量：22
4郭玲,郭泽睿.网络教育在大数据影响下的发展策略及方法研究[J].中国教育信息化,2017,23(13):21-26. 被引量：12
5陈章斌,王平.智慧校园环境下——云架构与大数据处理模式的研究[J].贵阳学院学报（自然科学版）,2017,12(3):13-16. 被引量：1
6史兆鹏,邹徐熹,向润昭.基于依存句法分析的多特征词义消歧[J].计算机工程,2017,43(9):210-213. 被引量：12
7芦丹,罗训.异构神经网络图像量化算法的相关探讨[J].数字技术与应用,2018,36(3):131-131.
8王浩茂,梁铮,周小茜,罗凌云.基于邻近概念信息的FMA本体概念名消歧法[J].医学信息学杂志,2018,39(3):60-64.
9谭红叶,武宇飞.汉语阅读理解中词义判断题的解答研究[J].计算机科学,2018,45(B06):72-74. 被引量：4
10曾维新,赵翔,冯滔,唐九阳.面向领域的命名实体消歧方法改进研究[J].计算机工程与应用,2018,54(17):126-134. 被引量：3

1倪洁琼,吴耿锋,郑宇.基于关系权重的文本表示法[J].计算机应用与软件,2009,26(5):68-69.
2张闻波.入侵监测系统在计算机网络安全中的作用[J].东北水利水电,2003,21(8):51-52. 被引量：1
3张付志.一个集成多媒体和数据库的专家系统[J].计算机工程与应用,2002,38(2):83-85.
4黄泳航,汤庸,李春英,汤志康,刘继伟.基于社区划分的学术论文推荐模型[J].计算机应用,2016,36(5):1279-1283. 被引量：10
5卢志茂,刘挺,李生.基于可拓学理论的汉语词义消歧[J].哈尔滨工业大学学报,2006,38(12):2026-2029. 被引量：1
6王细薇,张凯.一种改进的基于共现关系的短文本特征扩展算法研究[J].河南城建学院学报,2012,21(4):48-50. 被引量：4
7杨陟卓.基于上下文语境的词义消歧方法[J].计算机应用,2015,35(4):1006-1008. 被引量：4
8黄云,覃遵跃,卓月明.基于时空数据的社会关系发现[J].计算机应用研究,2011,28(8):3004-3006. 被引量：1
9谢芳,胡泉.基于BP神经网络的词义消歧模型[J].计算机工程与应用,2006,42(12):187-189. 被引量：3
10Fortinet与Riverbed结盟[J].数字通信世界,2008(3):93-93.

计算机研究与发展

2013年第2期

浏览历史

内容加载中请稍等...

基于异构关系网络图的词义消歧研究被引量：11

参考文献2

二级参考文献7

共引文献61

同被引文献85

引证文献11

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于异构关系网络图的词义消歧研究 被引量：11

参考文献2

二级参考文献7

共引文献61

同被引文献85

引证文献11

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于异构关系网络图的词义消歧研究被引量：11