期刊文献+

汉语词语语义相似度计算研究 被引量:63

Study on Chinese Words Semantic Similarity Computation
下载PDF
导出
摘要 汉语词语的语义相似度计算是中文信息处理中的一个关键问题。该文提出了一种基于知网、面向语义、可扩展的相似度计算新方法,该方法从信息论的角度出发,定义了知网义原间的相似度计算公式,通过对未登录词进行概念切分和语义自动生成,解决了未登录词无法参与语义计算的难题,实现了任意词语在语义层面上的相似度计算。针对同义词词林的实验结果表明,该方法的准确率比现有方法高出近15个百分点。 Similarity computation of Chinese words is a key problem in Chinese information processing. This paper proposes a new method on similarity computation which is based on Hownet, geared to semantic and could be expanded. The new method defines a similarity computation formula among Hownet's sememes according to information theory, finds a way out of the difficulty that OOV words cannot participate in semantic computation by implementing concept segmentation and automatic semantic production to OOV words, and realizes the similarity computation on the semantic level among arbitrary words finally. Experimental result of CILIN indicates that the accuracy rate of the new method is nearly 15% higher than present ones.
作者 夏天
出处 《计算机工程》 CAS CSCD 北大核心 2007年第6期191-194,共4页 Computer Engineering
基金 中国人民大学科学研究青年基金资助项目 数据工程与知识工程教育部重点实验室(中国人民大学)开放课题基金资助项目
关键词 词语相似度 知网 概念 义原 Words similarity Hownet Concept Sememe
  • 相关文献

参考文献8

二级参考文献18

  • 1王源,吴晓滨,涂从文,刘滨,章元峰,王金娥.后控规范的计算机处理[J].现代图书情报技术,1993(2):4-7. 被引量:30
  • 2-.现代汉语词典[M].北京:商务印书馆,1994..
  • 3宋明亮 张琪玉.报纸文献机助自由标引研究及对后控制词表动态维护的思维:硕士论文[M].空军政治学院,1994,6..
  • 4吴志强 侯汉清.经济信息检索后控制词表的研制:硕士论文[M].南京:南京农业大学,1999,6..
  • 5朱毅华 侯汉清.智能搜索引擎中同义词识别算法的研究:硕士论文[M].南京:南洋农业大学,2001,6..
  • 6李朝阳 侯汉清.汉语科技同义词字面相似度测试[J].理论学术年刊,1998,.
  • 7[1]Yarowsky D.Unsupervised Word Sense Disambiguation Rivaling Supervised Methods.In:proc 33rd Annual Meeting of ACL. Cambridge:[s.n],1995,181~188
  • 8Voorhees E. The TREC-8 question answering track report[A]. In: Proceedings of the 8th Text Retrieval Conference NIST[C]. Gaithersburg, MD, 1999. 77-82.
  • 9Katz B, Lin J, Felshin S. Gathering knowledge for a question answering system from heterogeneous information sources [A]. In: Proceedings of the ACL 2001 Workshop on Human Language Technology and Knowledge Management[C]. Toulouse, France. 2001.
  • 10张德.[D].南京:东南大学计算机科学与工程系,2002.

共引文献181

同被引文献559

引证文献63

二级引证文献348

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部