-
题名深度嵌入聚类及其在投诉文本分析中的应用
- 1
-
-
作者
刘菲林
邵立伟
黄德皇
喇磊
-
机构
对外经济贸易大学信息学院
中山市北京理工大学研究院
-
出处
《计算机科学与应用》
2023年第4期853-864,共12页
-
文摘
针对互联网存在的巨量涉及电力投诉的用户生成超短文本,本文提出一种基于深度嵌入的聚类模型,以实现互联网电力投诉文本话题识别的方法。首先,通过改进算法进行词嵌入,以提高文本特征的语义丰度并降低数据集维度;然后,在词嵌入的基础上,借助Sentence-Bert进行句子相似度计算,从而实现短文本聚类;最后,在自主爬取的互联网用户留言中涉及电力投诉的文本数据集上部署提出的方法,完成了投诉文本的话题聚类,并与多个已有的话题识别算法在同一数据集上的效果进行比较,证明了提出模型的有效性。
-
关键词
词嵌入
Sententce-Bert
短文本聚类
话题识别
电力投诉
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-