期刊文献+

基于文本相似度的煤炭地质成果查重算法应用研究

下载PDF
导出
摘要 本文以全国重要煤炭地质钻孔数据库建设项目中的煤炭地质成果查重系统建设子项目为基础,结合该项目的中文文本属性特征,阐述了中文文本预处理和相关算法描述,并对比分析了传统中文文本语义相似度算法与基于K-Means的中文文本聚类算法的精确度。对当前应用比较广泛的K-Means算法进行了改进,构建了符合项目需求的中文文本算法模型以及聚类函数,在搭建煤炭地质成果查重系统过程中予以应用,通过运行结果证明了改进算法的合理性,为该项目的实施提供了算法基础,提升了中文文本聚类算法的精确度。
作者 王铮
出处 《中国科技期刊数据库 工业A》 2021年第8期283-285,共3页
关键词 成果 地质 研究
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部