期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于公共词集对长篇小说相似度的研究
1
作者 郭涛 霸元婕 李绍昂 《软件工程》 2018年第10期11-13,10,共4页
传统的文本相似度计算基于向量空间模型(VSM),文本映射成独立的、互不关联的词构成的向量。由于长篇小说具有比普通文本更为复杂的构成元素,以及更加紧密的上下文联系,传统算法忽略词项的上下文联系,并且产生高维向量,因此算法的效率和... 传统的文本相似度计算基于向量空间模型(VSM),文本映射成独立的、互不关联的词构成的向量。由于长篇小说具有比普通文本更为复杂的构成元素,以及更加紧密的上下文联系,传统算法忽略词项的上下文联系,并且产生高维向量,因此算法的效率和精度不理想。为此,本文基于公共词集对长篇小说进行相似度计算,并对公共词集进行上下文约束检查,得到关联比较紧密的词集,作为小说的主要特征。实验结果表明,对于某些小说类型,效果有很大的提升。 展开更多
关键词 公共词集 小说相似度 上下文约束
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部