期刊文献+

基于树状语料库的中文短语相似度计算 被引量:4

CHINESE SHORT SENTENCE SIMILARITY CALCULATION BASED ON TREE-STRUCTURE CORPUS
下载PDF
导出
摘要 在诸如文件摘要、个性化搜索、学术诚信检测、常见问题自动解答、自动翻译等领域,短语相似度计算是核心算法。通过引入树状语料库,精确定义、计算词汇相似度,对基于抽取关键词序列的中文短语相似度算法做进一步改进。实验证明,该方法在提高中文短语相似度计算的准确率上达到了预期效果,更符合人的直观感觉。 In many fields, such as document summarisation, personalised searching, detection of academic integrity, FQA and automatic translation, the short sentence similarity calculation is the core algorithm. Through introducing the tree-structure corpus, we accurately define the similarity of words and calculate it, and make further improvement on the Chinese short sentence similarity algorithm based on keywords sequence extraction. Results of experiment show that this method achieves expected effect in improving the accuracy of Chinese short sentence similarity calculation, and is more in line with people's intuitive sense.
出处 《计算机应用与软件》 CSCD 北大核心 2013年第8期18-20,42,共4页 Computer Applications and Software
基金 国家自然科学基金项目(61073186) 中南大学米塔尔学生创新创业项目(11MX07)
关键词 自然语言处理 文件摘要 中文短语相似度计算 树状语料库 关键词序列 Natural language processing Document summarisation Chinese short sentence similarity calculation Tree-structure corpus Keywords sequence
  • 相关文献

参考文献8

二级参考文献40

共引文献161

同被引文献55

引证文献4

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部