期刊文献+

中文短文本语法语义相似度算法 被引量:13

A Chinese Short Text Similarity Algorithm Based on Semantic and Syntax
下载PDF
导出
摘要 通过分析中文短文本的特征,提出了一种基于语法语义的短文本相似度算法.该算法结合中文语句语义的相似性以及语句语法的相似性,即计算具有相同句法结构的短文本的相似度以及考虑语句词组顺序对相似度的贡献,对中文短文本相似度进行计算.实验表明,本文提出的算法在中文短文本相似度计算结果上更加接近人们的主观判断并且拥有比较好的精确率与召回率. A short text algorithm based on semantic and syntax by analyzing the characteristics of Chinese short text was proposed. The algorithm combines semantic similarity with the similarity of sentence syntax in Chinese short text, that is to say, to calculate the similarity of short text with the same syntax structure and consider the contribution with sentence words order to similarity. The experiments show that the proposed algorithm is closer to people's judgment and gets a better precision rate and recall rate in the aspect of Chinese short text similarity calculation results.
出处 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第2期135-140,共6页 Journal of Hunan University:Natural Sciences
基金 国家自然科学基金青年基金资助项目(61202095) 湖南省自然科学基金资助项目(12JJ3074)~~
关键词 语法语义相似度 语句相似性计算 HOWNET 语料库 语法分析 语义分析 相似度计算 semantic and syntax similarity sentence similarity calculating HowNet corpus semantie analysis syntax analysis similarity measure
  • 相关文献

参考文献9

  • 1蒋溢,丁优,熊安萍,王化晶.一种基于知网的词汇语义相似度改进计算方法[J].重庆邮电大学学报(自然科学版),2009,21(4):533-537. 被引量:22
  • 2廖志芳,邱丽霞,谢岳山,樊晓平.一种频率增强的语句语义相似度计算[J].湖南大学学报(自然科学版),2013,40(2):82-88. 被引量:6
  • 3李连,朱爱红,苏涛.一种改进的基于向量空间文本相似度算法的研究与实现[J].计算机应用与软件,2012,29(2):282-284. 被引量:35
  • 4OLIVA J, SERRANO J I, CASTILLO M D, etal. SyMSS: a syn- tax-based measure for short-text semantic similarity[J]. Data Knowledge Engineering, 2011,70(4) :390-405.
  • 5董振东,董强.关于知网一中文信息结构库[EB/OL]//http://www. keenage, eom/html/e_index, html.
  • 6The Stanford Natural Language Processing Group. The Stanford NLP[EB/OL]//http://nlp. stanford, edu/so:ftware/lex-parser, sht- ml.
  • 7ISLAM A, INKPEN D. Semantic text similarity using corpus-based word similarity and string similarity[R], Ottawa:University of Otta- wa, 2008.
  • 8LI Y H, MCLEAN D, BANDAR Z A, et al. Sentence similarity based on semantic nets and corpus statistics[J]. IEEE Transactions on Knowledge and Data Engineering, 2006,18(8) : 1138- 1150.
  • 9刘群 李素建.基于《知网》的词汇语义相似度计算[C]..第三界汉语词汇语义研讨会[C].台北,2002..

二级参考文献22

共引文献163

同被引文献119

引证文献13

二级引证文献71

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部