期刊文献+

基于同义替换和相邻词合并的关键词特征权重计算新方法 被引量:1

New Approaches of Keyword Feature Item Weighting Based on Synonymy Replace and Adjacent Merge
下载PDF
导出
摘要 特征项权重计算是文本挖掘中关键词提取的核心,其计算方法的好坏对文本挖掘的结果有着重要的影响。本文在对关键词提取特征项权重计算的传统TFIDF算法分析的基础上,为减少该算法特征权重计算时对词频的过于依赖,提出一种基于同义替换和相邻词合并(KSRAM)的特征权重计算方法。为检验算法性能,对KSRAM算法和传统TFIDF算法进行了关键词提取对比实验,实验表明KSRAM算法在关键词提取的准确率和召回率方面比传统TFIDF算法有明显的提高。 Feature item weighting is the core of the keywords extraction in text mining.The calculation approaches has an impor-tant impact to the result of text mining.This paper analyzes the shortage of the traditional TFIDF algorithm,and then proposes thenewapproaches of keyword feature item weighting based on synonymy replace and adjacent merge to reduce the over-reliance onword frequency when calculating the weight.In order to test algorithm performance,this paper does the keyword extraction com-parative experiment between KSRAMalgorithm and the traditional TFIDF algorithm,the result shows that the KSRAMalgorithm isbetter than TFIDF algorithm in precision and recall.
出处 《计算机与现代化》 2010年第4期115-117,121,共4页 Computer and Modernization
关键词 同义替换 相邻词 TFIDF KSRAM 特征权重 synonymy replace adjacent merge TFIDF KSRAM feature item weighting
  • 相关文献

参考文献9

二级参考文献36

共引文献295

同被引文献16

  • 1田春虎.国内语义Web研究综述[J].情报学报,2005,24(2):243-249. 被引量:37
  • 2孙吉红,刘伟成.基于语义网的信息过滤模型与算法[J].情报杂志,2007,26(1):2-4. 被引量:4
  • 3李洁,丁颖.语义网关键技术概述[J].计算机工程与设计,2007,28(8):1831-1833. 被引量:40
  • 4HERMAN I.W3C semantic Web activity[EB/OL].http:∥www.w3.org/2001/sw/,2007.
  • 5LEE T B.Semantic Web XML2000[EB/OL].http:∥WWW.W3.org/2000/Talks/1206-xral2k-tbl/,2007.
  • 6范志煜,肖兵,沈薇薇.基于概率本体的态势估计应用研究[C]∥中国自动化协会中南六省2010年第28届年会,2010.
  • 7NECHES R,et al.Enabling technology for knowledge sharing[J].AI Magazine,1991,12(3):36-56.
  • 8GURBER T R.A translation approach to portable ontologyspecifications[J].Knowledge Acquisition,1993,5(2):199-220.
  • 9http:∥baike.baidu.com/view/25441.htm.
  • 10http:∥baike.baidu.com/view/1008506.htm.

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部