期刊文献+

基于语义理解的文本相似度算法 被引量:80

Experimental research on premixed gases explosion in overpressure
下载PDF
导出
摘要 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. Text similarity counting has been widely used in several fields, for example, the field of copy detection and the field of information retrieval, etc.. With the study of text similarity computing and semantic understanding, the textural similarity counting can be expanded to paragraph similarity counting, and then the paragraph similarity counting can be expanded to article similarity counting. A new set of textural (including words, sentences and paragraphs) similarity algorithm is given. This algorithm can count out the similarity rate of two texts. Compared with other methods of similarity computing, the algorithm can raise the recall rate.
出处 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页 Journal of Dalian University of Technology
基金 国家自然科学基金资助项目(60073036 50275019)派生研究.
关键词 语义理解 相似度算法 相似度计算 计算方法 文本相似度 语义相似度 信息检索 实例验证 计算公式 准确性 文档 知网 Algorithms Information retrieval Knowledge representation Semantics Statistical methods Text processing
  • 相关文献

参考文献10

  • 1俞士汶 段慧明 田剪秋.机械文摘自动评测的原理及实现[A].吴泉源.智能计算机接口与应用进展—第三届中国计算机智能接口与智能应用学术会议论文集[C].北京:电子工业出版社,1998.230-233.
  • 2车万翔 刘挺 秦兵.面向双语句对检索的汉语句子相似度计算[A]..全国第七届计算语言学联合学术会议[C].北京:清华大学出版社,2003.81-88.
  • 3刘群 李素建.基于《知网》的词汇语义相似度计算[A]..第三届汉语词汇语义学研讨会[c].台北,2002..
  • 4李素建.基于语义计算的语句相关度研究[J].计算机工程与应用,2002,38(7):75-76. 被引量:83
  • 5董振东 董强.知网[EB/OL].http://www.keenage.com.,2003-07—12.
  • 6WILLETT P. Recent trends in hierarchical document clustering: a critical review [J]. Inf Process and Manage, 1988, 24(5) : 577-597.
  • 7SALTON G, BUCKLEY C. Term-weighting approaches in automatic text retrieval [J]. Inf Process and Manage, 1988, 24(5) : 513-523.
  • 8CALLAN J P. Passage-level evidence in document retrieval [A]. Proceedings of the Seventeenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C]. Dublin: [s n], 1994. 302-310.
  • 9AGIRRE E, RIGAU G. A proposal for word sense disambiguation using conceptual distance [A].International Conference on Recent Advances in Natural Language Processing [C]. Velingrad : [s n],1995. 258-264.
  • 10ZHANG Hua-ping, Yu Hong-kui, Xiong De-yi, et al. HHMM-based Chinese lexieal analyzer ICTCLAS[A]. 41st Annual Meeting of the Association for Computational Linguistics [C]. Sapporo: [s n],2003. 184-187.

二级参考文献1

  • 1穗志文.基于骨架依存树的语句相似度计算模型[J].计算语言学文集,1998,(3):176-184.

共引文献99

同被引文献727

引证文献80

二级引证文献345

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部