摘要
术语是由一个到多个单词按照某种语义角色组合而成的,传统的基于统计的相似度计算方法,将术语看作一个基本单元来进行计算,忽略了术语内部的语义角色,且对于上下文信息不丰富的术语,无法利用统计的方法取得理想的效果;基于语义资源的相似度计算方法,所涵盖的词语有限,因此不包含在语义资源中的术语便无法计算相似度。针对这些问题,该文针对专利提出了基于语义角色的术语相似度计算方法,该方法弥补了传统方法的不足。该文对术语内部的单词进行语义角色标注,通过共享最近邻方法计算单词的相似度,然后根据不同的语义角色,利用单词相似度来计算术语相似度。实验表明,该方法与传统方法相比,取得了较好的效果。
The Chinese term is composed of one or multiple words with certain semantic roles.The traditional similarity calculation methods based on statistics,which regard the term as a basic unit for similarity computation,ignore the semantic roles inside a term.This paper presented a method for computing similarity of Chinese terms based on the internal semantic roles,i.e.calculating term similarity according to the different semantic roles assigned to them automatically.Experiments show that the proposed similarity calculation method achieves better results than traditional methods.
作者
姜利雪
季铎
蔡东风
JIANG Lixue JI Duo CAI Dongfeng(Knowledge Engineering Research Center, Shenyang Aerospace University, Shenyang, Liaoning 110136, China)
出处
《中文信息学报》
CSCD
北大核心
2016年第4期37-43,共7页
Journal of Chinese Information Processing
基金
国家"十二五"科技支撑计划项目(2012BAH14F00)
关键词
术语
内部语义角色
共享最近邻
术语相似度
专利文本
term
internal semantic roles
shared nearest neighbor
term similarity
patent text