期刊文献+

专利中基于语义角色的术语相似度计算方法 被引量:2

Measuring Term Similarity Based on Internal Semantic Role in Patent Text
下载PDF
导出
摘要 术语是由一个到多个单词按照某种语义角色组合而成的,传统的基于统计的相似度计算方法,将术语看作一个基本单元来进行计算,忽略了术语内部的语义角色,且对于上下文信息不丰富的术语,无法利用统计的方法取得理想的效果;基于语义资源的相似度计算方法,所涵盖的词语有限,因此不包含在语义资源中的术语便无法计算相似度。针对这些问题,该文针对专利提出了基于语义角色的术语相似度计算方法,该方法弥补了传统方法的不足。该文对术语内部的单词进行语义角色标注,通过共享最近邻方法计算单词的相似度,然后根据不同的语义角色,利用单词相似度来计算术语相似度。实验表明,该方法与传统方法相比,取得了较好的效果。 The Chinese term is composed of one or multiple words with certain semantic roles.The traditional similarity calculation methods based on statistics,which regard the term as a basic unit for similarity computation,ignore the semantic roles inside a term.This paper presented a method for computing similarity of Chinese terms based on the internal semantic roles,i.e.calculating term similarity according to the different semantic roles assigned to them automatically.Experiments show that the proposed similarity calculation method achieves better results than traditional methods.
作者 姜利雪 季铎 蔡东风 JIANG Lixue JI Duo CAI Dongfeng(Knowledge Engineering Research Center, Shenyang Aerospace University, Shenyang, Liaoning 110136, China)
出处 《中文信息学报》 CSCD 北大核心 2016年第4期37-43,共7页 Journal of Chinese Information Processing
基金 国家"十二五"科技支撑计划项目(2012BAH14F00)
关键词 术语 内部语义角色 共享最近邻 术语相似度 专利文本 term internal semantic roles shared nearest neighbor term similarity patent text
  • 相关文献

参考文献3

二级参考文献21

  • 1余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量:25
  • 2章志凌,虞立群,陈奕秋,罗海飞,邵晓敏.基于Corpus库的词语相似度计算方法[J].计算机应用,2006,26(3):638-640. 被引量:17
  • 3秦春秀,赵捧未,刘怀亮.词语相似度计算研究[J].情报理论与实践,2007,30(1):105-108. 被引量:30
  • 4程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报(自然科学版),2007,25(2):145-148. 被引量:11
  • 5关毅,王晓龙.基于统计的汉语词汇间语义相似度计算[C]//全国第七届计算语言学联合学术会议论文集,哈尔滨,2003:221-227.
  • 6Chomsky N.乔姆斯基语言理论介绍·乔姆斯基序[M].黑龙江:黑龙江大学出版社,1982:1-2.
  • 7Miller GA,Fellbaum C.Semantic network of English[M].Levin B,pinker S.lexical & conceptual semantics Amsterdam,Netherlands:Elsevier Science Publishers,1991.
  • 8P.Brown,S.Delia Pietra,V.Delia Pietra,and R.Mercer.(1991) Word sense disambiguation using statistical methods[C]//Proceedings of the 29th Meeting of the Association for Computational Linguistics (ACL-91),Berkley,C.A.,1991:264-270.
  • 9Lillian Lee.Similarity-Based Approaches to Natural Language Processing[D].Ph.D.thesis.Harvard University Technical Report,TR-11-97.
  • 10Dagan I,Lee L.Similarity-based models of word cooc-currence probabilities[J].Machine Learning.Special Issue on Machine Learning and Natural Language,1999.

共引文献194

同被引文献31

引证文献2

二级引证文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部