期刊文献+

科技文献关键词冗余解决方案研究 被引量:2

Study on Solution to Redundancy of Scientific Literature Keywords
原文传递
导出
摘要 提出一种改进的基于相似度计算的科技文献关键词选取算法。先利用N-gram算法提取领域词库,再综合利用领域词库和常识词库,对最初选择的关键词重新切分,进行给定关键词之间的语义对比。语义相似度大于一定阈值的关键词被认为是表达同一意义的同义词,将同义词在文献库中合并,从而解决关键词冗余问题。实验结果可以证明该方法的有效性。 Irregular keywords often cause high redundancy in the same research topic. To address the issue, this paper proposes an improved keywords selection algorithm based on similarity calculation. It re - segments keywords using field dictionary and common -sense knowledge database thesaurus. When the total semantic similarity is greater than a given threshold, the two compared keywords are considered to express the same meaning, then merging and keeping only one of them in library, which achieves the purpose of the dimension reduction. Finally, experimental results show the effective- ness of the method.
作者 邢美凤
出处 《现代图书情报技术》 CSSCI 北大核心 2012年第1期34-39,共6页 New Technology of Library and Information Service
关键词 科技文献关键词 冗余 语义相似度 特征降维 Scientific literature keywords Redundancy Semantic similarity Feature reduction
  • 相关文献

参考文献21

二级参考文献57

共引文献258

同被引文献35

引证文献2

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部