期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基於《知网》的辞汇语义相似度计算
1
作者 劉群(qun liu) 李素建(Su-Jian Li) 《中文計算語言學期刊》
词义相似度计算在很多领域中都有广泛的应用,例如资讯检索、资讯抽取、文本分类、词义排歧、基於实例的机器翻译等等。词义相似度计算的两种基本方法是基於世界知识(Ontology)或某种分类体系(Taxonomy)的方法和基於统计的上下文向量空... 词义相似度计算在很多领域中都有广泛的应用,例如资讯检索、资讯抽取、文本分类、词义排歧、基於实例的机器翻译等等。词义相似度计算的两种基本方法是基於世界知识(Ontology)或某种分类体系(Taxonomy)的方法和基於统计的上下文向量空间模型方法。这两种方法各有优缺点。 《知网》是一部比较详尽的语义知识词典,受到了人们普遍的重视。不过,由於《知网》中对於一个词的语义采用的是一种多维的知识表示形式,这给词语相似度的计算带来了麻烦。这一点与WordNet和《同义词词林》不同。在WordNet和《同义词词林》中,所有同类的语义项(WordNet的synset或《同义词词林》的词群)构成一个树状结构,要计算语义项之间的距离,只要计算树状结构中相应结点的距离即可。而在《知网》中辞汇语义相似度的计算存在以下问题: 1.每一个词的语义描述由多个义原组成; 2.词语的语义描述中各个义原并不是平等的,它们之间有着复杂的关系,通过一种专门的知识描述语言来表示。 我们的工作主要包括: 1.研究《知网》中知识描述语言的语法,了解其描述一个词义所用的多个义原之间的关系,区分其在词语相似度计算中所起的作用;我们采用一种更为结构化的方式改写了《知网》中词的定义(DEF),其中采用了“集合”和“特徵结构”这两种抽象资料结构。 2.研究了义原的相似度计算方法、集合和特徵结构的相似度计算方法,并在此基础上提出了利用《知网》进行词语相似度计算的演算法; 3.通过实验验证该演算法的有效性,并与其他演算法进行比较。 展开更多
关键词 知網 辭彙語義相似度計算 自然語言處理
全文增补中
上一页 1 下一页 到第
使用帮助 返回顶部