期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

深度嵌入聚类及其在投诉文本分析中的应用

Deep Embedding Clustering and Its Application in Analysis of Complaint Text

下载PDF

导出

摘要针对互联网存在的巨量涉及电力投诉的用户生成超短文本,本文提出一种基于深度嵌入的聚类模型,以实现互联网电力投诉文本话题识别的方法。首先,通过改进算法进行词嵌入,以提高文本特征的语义丰度并降低数据集维度;然后,在词嵌入的基础上,借助Sentence-Bert进行句子相似度计算,从而实现短文本聚类;最后,在自主爬取的互联网用户留言中涉及电力投诉的文本数据集上部署提出的方法,完成了投诉文本的话题聚类,并与多个已有的话题识别算法在同一数据集上的效果进行比较,证明了提出模型的有效性。 In view of the huge amount of Internet user-generated ultra-short text involving power complaints, a clustering model based on deep embedding is proposed to realize the topic recognition method of Internet power complaints text in this paper. Firstly, word embedding is carried out by an improved algorithm to enhance the semantic richness of text features and reduce the dimension of data set. Then, sentence similarity is calculated by using Sentence-Bert to realize short text clustering based on word embedding. Finally, the proposed method is deployed on the text data set involving power complaints in the self-crawling Internet user messages to complete the topic clustering of the complaint text, and the effect of several existing topic recognition algorithms on the same data set is compared, which proves the effectiveness of the proposed model.

作者刘菲林邵立伟黄德皇喇磊

机构地区对外经济贸易大学信息学院中山市北京理工大学研究院

出处《计算机科学与应用》 2023年第4期853-864,共12页 Computer Science and Application

关键词词嵌入 Sententce-Bert 短文本聚类话题识别电力投诉

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献10

1张樯,程倩.服务型政府的知识建构与扩散——基于SKAD的5T话语分析[J].学习论坛,2020,36(4):46-52. 被引量：4
2李晓飞.户籍分割、资源错配与地方包容型政府的置换式治理[J].公共管理学报,2019,16(1):16-28. 被引量：8
3丁志刚,王杰.中国行政体制改革四十年:历程、成就、经验与思考[J].上海行政学院学报,2019,20(1):35-48. 被引量：14
4胡洋,田兵,雷金勇,袁智勇,马溪原,余文辉,马建勋.面向能源互联的分布式发电系统聚合服务运营模式分析[J].中国电力,2020,53(8):1-8. 被引量：10
5朱州.基于大数据分析的电力客户服务需求预测[J].沈阳工业大学学报,2020,42(4):368-372. 被引量：15
6冷媛,陈政,黄国日,张朋宇,韩士琦,王鹏.偏远山区电力普遍服务微网优化模型研究[J].智慧电力,2020,48(6):61-66. 被引量：3
7刘志欣,黄旭,魏加项,于亮,苏保强,张皓,冯冰清.基于95598大数据的电力客户满意度分析[J].电力大数据,2018,21(8):19-24. 被引量：6
8吴艾薇,雷景生.面向电力客户投诉信息的短文本分类算法的改进技术[J].上海电力学院学报,2017,33(6):597-600. 被引量：3
9杨东红,吴邦安,陈天鹏,薛红燕.基于京东商城评价数据的在线商品好评、中评、差评比较研究[J].情报科学,2019,37(2):125-132. 被引量：17
10孙长伟,任宗来,杨俊杰,庞坤亮.基于评论数据的酒店服务质量的细粒度分析[J].计算机应用与软件,2019,36(7):32-38. 被引量：13

二级参考文献113

1刘怀亮,张治国,马志辉,孙蕾.基于SVM与KNN的中文文本分类比较实证研究[J].情报理论与实践,2008,31(6):941-944. 被引量：10
2彭希哲,万芊,黄苏萍.积分权益制:兼顾户籍改革多重目标的普惠型制度选择[J].人口与经济,2014(1):28-36. 被引量：11
3闫强,孟跃.在线评论的感知有用性影响因素——基于在线影评的实证研究[J].中国管理科学,2013,21(S1):126-131. 被引量：67
4李翔,杨淑霞,张红斌.供电服务质量评价方法研究[J].电网技术,2004,28(12):34-38. 被引量：39
5刘熙瑞.服务型政府——经济全球化背景下中国政府改革的目标选择[J].中国行政管理,2002(7):5-7. 被引量：1061
6程倩.“服务行政”:从概念到模式——考察当代中国“服务行政”理论的源头[J].南京社会科学,2005(5):50-57. 被引量：52
7张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量：97
8孟明,牛东晓,谷志红.基于模糊熵的电力客户满意度评价模型[J].华北电力大学学报（自然科学版）,2005,32(4):68-70. 被引量：25
9闫晓天,魏宏俊.电力客户满意度评价体系的建立与应用[J].华东电力,2005,33(12):52-55. 被引量：23
10王平,邹珊刚.电力行业用户满意度指数模型构建与实证研究[J].武汉理工大学学报（信息与管理工程版）,2006,28(3):145-149. 被引量：12

共引文献82

1丁煌,卫劭华.“小马拉大车”:本土情境中基层政府的负重运作现象考察——基于W区Q镇环保项目推进案例的实证分析[J].行政论坛,2021,28(2):106-115. 被引量：22
2龚丽娟,王昊,张紫玄,朱立平.Word2Vec对海关报关商品文本特征降维效果分析[J].数据分析与知识发现,2020,4(2):89-100. 被引量：7
3王博,张耀宇,冯淑怡.地方政府干预、土地价格扭曲与工业企业生产率[J].经济理论与经济管理,2021,41(7):51-63. 被引量：16
4张璐.“双碳”目标对我国可再生能源立法的影响及其应对[J].北方法学,2022,16(2):16-26. 被引量：22
5孙广生,姚玉德,火传斌,肖思华.山东省黄河防汛存在的主要问题及对策[J].水利建设与管理,2000,20(3):10-12.
6刘福寿.我国保险监管法制建设70年:回顾与展望[J].保险研究,2019,0(9):3-10. 被引量：4
7袁维海.深化党和国家机构改革的理论逻辑和实践创新[J].行政管理改革,2019,0(9):72-78. 被引量：6
8关菲,姜小冬.基于手机在线评论的特征挖掘[J].经济研究导刊,2019,0(31):168-169. 被引量：2
9陈菡.关于修订完善《事业单位财务规则》的思考[J].财务与会计,2019,0(21):15-18. 被引量：2
10刘志伟,宫立华,王飞飞,朱银龙,王祎.供电营业厅服务效能评价研究[J].电力需求侧管理,2020,22(1):97-100. 被引量：3

1董东.文本分析途径的课程持续改进目标识别[J].软件导刊,2023,22(2):132-135.
2王燕凤.基于自然语言处理的文本自动校对系统及实验结果分析[J].科学技术创新,2023(5):109-112. 被引量：1
3袁建华,罗为明.自动驾驶运行安全要素与实证技术[J].道路交通科学技术,2023(2):14-17.
4马荣鸿,许家敏,李进,袁洪根,张财志.基于DK聚类模型的多工况速度预测器[J].重庆大学学报,2023,46(4):1-12. 被引量：1
5孙纯,付谦.国外脑卒中服务系统整合策略、影响因素与评价研究的范围综述[J].中华医院管理杂志,2022,38(12):920-926.
6李青,韩永辉,张双钰.中国参与全球价值链治理的历史经验、现实约束和战略选择[J].长安大学学报（社会科学版）,2023,25(2):36-52. 被引量：2
7江雨燕,邵金,李平.融入无监督度量学习的稀疏子空间聚类模型[J].小型微型计算机系统,2023,44(5):1002-1007.
8马全海,张冬梅,车骏,李成卓.基于K均值聚类算法的生源质量评价体系研究[J].电脑编程技巧与维护,2023(4):54-56.
9薛诗琦,王阿川.一种基于SWF-BERT的软件缺陷报告严重性预测方法[J].小型微型计算机系统,2023,44(6):1338-1344. 被引量：1

计算机科学与应用

2023年第4期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部