期刊文献+

一种面向故障短文本的改进聚类方法研究

A study of an Improved Clustering Method for Fault-oriented Short Texts
下载PDF
导出
摘要 在航空制造领域中,为了解决故障数据质量不高且多为短文本的问题,本文提出了一种改进的短文本聚类方法。首先通过自动编码器模块提取文本的全局语义信息,再通过关键语义提取模块提取文本中的关键语义信息,最终将两者提取的特征融合后使用K-means进行文本聚类。该方法有效地解决了传统自动编码器在训练过程中丢失语义信息和过度依赖原始数据质量的问题。实验表明,本文提出的方法聚类效果优于现有的聚类算法,同时聚类结果也证明了关键语义信息对文本聚类的重要性。 In the field of aeronautical manufacturing,in order to solve the fault data with low quality and mostly short text,this paper pin proposes a text clustering method.Firstly,the method extracts the global semantic information of the text through the AutoEncoder module,then extracts the key semantic information in the text through the key semantic extraction module,and finally fuses the two extracted features to perform text clustering using K-Means.The method effectively solves the problems of losing semantic information and over-reliance on raw data quality in the training process of traditionalAutoEncoder.Experiments show that the clustering effect of the method proposed in this paper is better than the existing clustering algorithms,and the clustering results also prove the importance of key semantic information for text clustering.
作者 周志宇 郭朝阳 余志斌 张士举 杨丰玉 Zhou Zhiyu;Guo Chaoyang;Yu Zhibin;Zhang Shiju;Yang Fengyu(AVIC Jiangxi Hongdu Aviation Industry Group Compa,Nanchang,China;College of Software,Nanchang Hangkong University,Nanchang,China)
出处 《科学技术创新》 2024年第10期70-73,共4页 Scientific and Technological Innovation
基金 江西省重点研发计划(20202BBEL53002)。
关键词 文本聚类 自动编码器 K-MEANS 关键语义 特征融合 text clustering auto encoder K-Means key semantics feature fusion
  • 相关文献

参考文献1

二级参考文献7

共引文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部