-
题名基于语义角色标注的汉语句子相似度算法
被引量:11
- 1
-
-
作者
田堃
柯永红
穗志方
-
机构
北京大学信息科学技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2016年第6期126-132,共7页
-
基金
国家"973"计划(2014CB340504)
-
文摘
在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。
-
关键词
语义角色标注
词语相似度
知网
词向量
标注句型匹配
-
Keywords
semantic roles annotation
word similarity
How-net
word vector
annotated sentence match
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-