期刊文献+

基于词汇语义计算的文本相似度研究 被引量:25

Research of text similarity based on word similarity computing
下载PDF
导出
摘要 基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本所蕴涵概念的目的,并用实验对该方法的有效性进行了验证,提出了今后的改进方向。 The algorithm used to compute word similarity based on how-net opens out some relational information between words. Ac- cording to VSM, the algorithm was adopted to compute two texts pertinence. And the biggest matching algorithm was used to compute similarity. Experiments showed the validity of algorithm. Finally, development direction in future was presented.
出处 《计算机工程与设计》 CSCD 北大核心 2006年第2期241-244,共4页 Computer Engineering and Design
基金 重庆大学教师资助计划基金项目(2003A33)
关键词 《知网》 相似度计算 义原 匹配 向量空间模型 how-net similarity computing sememe matching VSM
  • 相关文献

参考文献6

二级参考文献9

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4穗志文.基于骨架依存树的语句相似度计算模型[J].计算语言学文集,1998,(3):176-184.
  • 5黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 6鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 7卜东波,博士学位论文,2000年
  • 8Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 9Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页

共引文献517

同被引文献223

引证文献25

二级引证文献346

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部