-
题名基于词语距离的网络图词义消歧
被引量:22
- 1
-
-
作者
杨陟卓
黄河燕
-
机构
北京市海量语言信息处理与云计算应用工程技术研究中心(北京理工大学)
北京理工大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2012年第4期776-785,共10页
-
基金
国家自然科学基金(61132009)
国防基础基金
北京理工大学科技创新计划重大项目培育专项计划
-
文摘
传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消歧模型.该模型在传统的网络图词义消歧模型的基础上,充分考虑了词语距离对消歧效果的影响.通过模型重构、优化改进、参数估计以及评测比较,论证了该模型的特点:距离歧义词较近的词语,会对其词义有较强的推荐作用;而距离较远的词,会对其词义有较弱的推荐作用.实验结果表明,该模型可以有效提高中文词义消歧性能,与SemEval-2007:task#5最好的成绩相比,该方法在MacroAve(macro-average accuracy)上提高了3.1%.
-
关键词
词语距离
马尔可夫链
网络图模型
PAGERANK
参数估计
-
Keywords
word distance
Markov chain
graph based model
PageRank
parameter estimation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-