期刊文献+

基于文本聚类的档案数据全自动分类方法研究 被引量:1

Research on automatic classification of archival data based on Text Clustering
下载PDF
导出
摘要 大数据时代下,档案文本数据规模海量递增,增加了聚类分析的难度,如何准确、高效的实现档案数据全自动分类。而针对以往PSI算法在高纬度、稀疏特征中易于陷入局部最优,本文引入GWO算法,通过对种群精英个体的克隆和变异,及基于DE算法的个体更新算法创新,来规避早期收敛和局部最优的问题,而后,引入FastText有监督快速分类方法,基于softmax分层技术完成海量档案数据的全自动化分类,以提升档案分类的可靠性和效率。 In the era of big data,the scale of file text data increases massively,which increases the difficulty of clustering analysis.How to realize the automatic classification of archival data accurately and efficiently.In order to avoid the problems of early convergence and local optimization,the GWO algorithm is introduced to avoid the problems of early convergence and local optimization by cloning and mutation of elite individuals in the population,and the innovation of individual update algorithm based on DE algorithm.Then,fasttext supervised fast classification method is introduced,In order to improve the reliability and efficiency of file classification,the full automatic classification of massive archive data is completed based on softmax layered technology.
作者 于红 Yu Hong(Jingxin Town Health Center,Yanbian Jilin,133300)
出处 《电子测试》 2021年第14期53-54,共2页 Electronic Test
关键词 聚类分析 GWO算法 档案数据 局部最优 cluster analysis GWO algorithm archive data local optimum
  • 相关文献

参考文献4

二级参考文献48

共引文献27

同被引文献12

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部