期刊文献+

一种新的词语权重计算方法 被引量:1

A Novel Term Global Weighting Method
下载PDF
导出
摘要 词语权重计算是自然语言处理中的重要问题,是文档语义表示的重要实现手段.词语的权重主要由两部分决定,一部分是词语在文档中的重要性度量,另一部分是基于统计方法所得的词语在区分不同文档能力上的度量即词语全局权重.本文就针对有相对稳定性的词语全局权重计算方法分析比较了现有的几种词语全局权重计算方法,并在此基础上提出了一种新的组合词语全局权重计算方法,实验证明本文提出的新方法能够有效地提高了系统的性能. 词语权重计算是自然语言处理中的重要问题,是文档语义表示的重要实现手段.词语的权重主要由两部分决定,一部分是词语在文档中的重要性度量,另一部分是基于统计方法所得的词语在区分不同文档能力上的度量即词语全局权重.本文就针对有相对稳定性的词语全局权重计算方法分析比较了现有的几种词语全局权重计算方法,并在此基础上提出了一种新的组合词语全局权重计算方法,实验证明本文提出的新方法能够有效地提高了系统的性能.
出处 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第S1期315-318,共4页 Journal of Harbin Institute of Technology
基金 哈尔滨工业大学科研创新基金(HIT.NSRIF.2010045)
关键词 信息检索 语义相似度计算 词语权重计算 Information Retrieval Semantic similarity computation Term global weighting
  • 相关文献

参考文献9

  • 1陆玉昌,鲁明羽,李凡,周立柱.向量空间法中单词权重函数的分析和构造[J].计算机研究与发展,2002,39(10):1205-1210. 被引量:126
  • 2刁倩,王永成,张惠惠,何骥.VSM中词权重的信息熵算法[J].情报学报,2000,19(4):354-358. 被引量:8
  • 3A.Singhal.Term Weighting Revisited. . 1996
  • 4G.Salton,C.Buckley.Term Weighting Approachesin Automatic Text Retrieval. Information Process-ing and Management . 1989
  • 5T.Mori.A Term Weighting Method Based on Informa-tion Gain Ratio for Summarizing Documents Retrievedby IR Systems. Journal of Natural Language Pro-cessing . 2000
  • 6Y.Guan,X.L.Wang,Y.Zhao,J.Zhao.TheResearch on Professional Website Oriented ChineseQuestion Answering System. 20th InternationalConference on Computer Processing of Oriental Lan-guages . 2003
  • 7Xu JX,Croft WB.Query expansion using local and global document analysis. Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval . 1996
  • 8Robertson, S. E,Walker, S,Hancock-Beaulieu, M,Gatford, M.Okapi in TREC3. Proceedings of Text REtrieval Conference . 1994
  • 9Hassan S,Mihalcea R,Banea C.Random-Walk Term Weighting for Improved Text Classification. Proc of the IEEE International Conference on Semantic Computing . 2007

二级参考文献4

  • 1[1]Warren R.Greiff. A Theory of Term Weighting Based on Exploratory Data Analysis.www.cs.umass. Edu/~greiff/
  • 2[2]S.Kaski,K.Lagus,T.Honkela and T.Kohonen. Statistical Aspects of the WEBSOM System in Organizing Document Collections.Computer Science and Statistics, 1998,29,281~290
  • 3[3]Robert Trappl. Cybernetics Theory and Applications. Hemisphere Publication Corporation, 1983,9~20
  • 4李凡,鲁明羽,陆玉昌.关于文本特征抽取新方法的研究[J].清华大学学报(自然科学版),2001,41(7):98-101. 被引量:78

共引文献132

同被引文献4

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部