摘要
给出了一个新的用于计算WordNet中概念的语义相似度的IC(信息内容)模型。该模型以WordNet的is_a关系为基础,只通过WordNet本身结构就可求出WordNet中每个概念的IC值,而不需要其他语料库的参与。该模型不仅考虑了每个概念所包含的子节点的个数,而且将该概念所处WordNet分类树中的深度引入到模型当中,使得概念的IC值更为精确。实验结果显示将该模型代入到多个相似度算法当中,可以明显提高这些算法的性能。
A new Information Content(IC) model for semantic similarity in WordNet is given in this paper.The model is based on the is_a relationship of WordNet,and can be calculated only depends on WordNet itself without other corpus.The model considers not only the number of hyponyms of the concept,but also the depth in the tree of taxonomy of WordNet, so as to make the value of IC of the concept more accurate.The experimental results show that the performance of the semantic similarity algorithms using this new model can be improved.
出处
《计算机工程与应用》
CSCD
北大核心
2011年第19期128-131,共4页
Computer Engineering and Applications
基金
山东省优秀中青年科学家科研奖励基金(No.BS2010DX012)