摘要
论文提出一个基于语义的文本间的相似度算法,以文本的特征词相似度为基础,来计算文本间的相似度,利用聚类算法对文本簇进行聚类。实验结果证明基于知网的文本语义相似度方法在对文本相似度计算以及文本聚类方面,能有效提高聚类的效果。
A similarity algorithm based on semantic similarity is proposed,which calculates the similarity of texts according to feature words of the text and makes text clusters by employing clustering algorithm.The experimental results prove that the method of text semantic similarity based on CNKI is very efficient in text similarity calculation and text clustering,which can effectively improve the effect of clustering.
出处
《计算机与数字工程》
2014年第2期187-189,209,共4页
Computer & Digital Engineering
基金
河南省教育厅科学技术研究重点项目(编号:12B520063)资助
关键词
文本聚类
义原相似度
语义相似度
text clustering
primitive similarity
semantic similarity