期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于N元语法的英文学术文献聚类标签抽取算法 被引量:3
1
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《现代图书情报技术》 CSSCI 北大核心 2011年第7期68-75,共8页
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最... 提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。 展开更多
关键词 聚类标签 n元语法 学术文献聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部