-
题名基于抽象概念的知网词语相似度计算
被引量:5
- 1
-
-
作者
朱新华
郭小华
邓涵
马润聪
-
机构
广西师范大学计算机科学与信息工程学院
广西区域多源信息集成与智能处理协同创新中心
-
出处
《计算机工程与设计》
北大核心
2017年第3期664-670,713,共8页
-
基金
国家自然科学基金项目(61462010
61363036)
-
文摘
针对基于知网的词语相似度算法进行研究,提出一种基于抽象概念的词语相似度的快速计算方法。将《知网》义项语义表达式中带有关系约束的第一独立义原定义成抽象概念,将义项语义表达式转换成一个多层次的抽象概念组;根据义项定义中的抽象概念将义项挂到《知网》现有的义原树中,形成一棵包含义原、抽象概念与义项等概念的义项树;利用义项树中的深度与路径,在现有优秀算法基础上,通过适当的义项定义的预处理与参数调节,直接计算义项间的语义相似度,避免复杂的意义相似性计算。实验结果表明,该方法对于MC30词对的相似度计算值与人工判定值相比,取得了0.84的Pearson相关系数,达到了目前优秀词语相似度算法的水平。
-
关键词
词语相似度
知网
义项树
抽象概念
最短路径
深度
-
Keywords
word similarity
HowNet
sense tree
abstract concept
shortest path
depth
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-