期刊文献+

基于知网义原信息量的词语相似度计算方法 被引量:4

下载PDF
导出
摘要 国内利用知网计算中文词语相似度通常采用基于义原距离的方法,这些方法依赖于公式设计和参数选取。根据信息论中计算两个事物相似度的思想,利用知网的分类体系来计算词语所包含的义原信息量,将义原及其角色关系的信息量作为词语相似度计算的基本单位,通过计算两个词语的共有义原及其角色关系的信息量和所有义原及其角色关系的信息量的比值来综合计算词语的相似度。实验结果证明,该方法合理可行。
出处 《软件导刊》 2015年第6期142-144,共3页 Software Guide
  • 相关文献

参考文献9

  • 1ENEKO AGIRRE,GERMAN RIGAU. A proposal for word sensedisambiguation using conceptual distance[C]. Proceedings of theFirst International Conference on Recent Advanced in NLP,1995:258-264.
  • 2刘群,李素建.基于《知网》的词汇语义相似度的计算[C].台北:第三届汉语词汇语义学研讨会,2002.
  • 3董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量:99
  • 4DEKANG LIN. An information-theoretic definition of similarity[C]. Proceedings of the Fifteenth International Conference on Ma-chine Learning, 1998 : 296-304.
  • 5PHILIP RESNIK. Semantic similarity in a taxonomy: an informa-tion-based measure and its application to problems of ambiguity innatural language [J]. Journal of Artificial Intelligence Research,1999(2):95-130.
  • 6夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194. 被引量:63
  • 7张亮,尹存燕,陈家骏.基于语义树的中文词语相似度计算与分析[J].中文信息学报,2010,24(6):23-30. 被引量:36
  • 8王小林,王义.改进的基于知网的词语相似度算法[J].计算机应用,2011,31(11):3075-3077. 被引量:38
  • 9董强,董振东.知网简介[EB/OL].[2013-01-29]. http://www.keenage. com/.

二级参考文献29

共引文献253

同被引文献32

引证文献4

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部