A Short Text Classification Model for Electrical Equipment Defects Based on Contextual Features 被引量：1

导出

摘要 The defective information of substation equipment is usually recorded in the form of text. Due to the irregular spoken expressions of equipment inspectors, the defect information lacks sufficient contextual information and becomes more ambiguous.To solve the problem of sparse data deficient of semantic features in classification process, a short text classification model for defects in electrical equipment that fuses contextual features is proposed. The model uses bi-directional long-short term memory in short text classification to obtain the contextual semantics of short text data. Also, the attention mechanism is introduced to assign weights to different information in the context. Meanwhile, this model optimizes the convolutional neural network parameters with the help of the genetic algorithm for extracting salient features. According to the experimental results, the model can effectively realize the classification of power equipment defect text. In addition, the model was tested on an automotive parts repair dataset provided by the project partners, thus enabling the effective application of the method in specific industrial scenarios.

作者 LI Peipei ZENG Guohui HUANG Bo YIN Ling SHI Zhicai HE Chuanpeng LIU Wei CHEN Yu

机构地区 School of Electrical and Electronic Engineering CSG Smart Science&Technology Co State Grid Shanghai Municipal Electric Power Company

出处《Wuhan University Journal of Natural Sciences》 CAS CSCD 2022年第6期465-475,共11页 武汉大学学报（自然科学英文版）

基金 Supported by the Scientific and Technological Innovation 2030—Major Project of "New Generation Artificial Intelligence"(2020AAA0109300)。

关键词 short text classification genetic algorithm convolutional neural network attention mechanism

分类号 TN918 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1刘梓权,王慧芳,曹靖,邱剑.基于卷积神经网络的电力设备缺陷文本分类模型研究[J].电网技术,2018,42(2):644-650. 被引量：105

二级参考文献7

1宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935. 被引量：541
2赵腾,张焰,张东霞.智能配电网大数据应用技术与前景分析[J].电网技术,2014,38(12):3305-3312. 被引量：181
3马润泽,王龙响,余佳文,王慧芳,邱剑.考虑历史缺陷文本信息的断路器状态评价研究[J].机电工程,2015,32(10):1375-1379. 被引量：17
4苗新,张东霞,孙德栋.在配电网中应用大数据的机遇与挑战[J].电网技术,2015,39(11):3122-3127. 被引量：57
5王相伟,史玉良,张建林,梁波,程翠萍.基于Hadoop的用电信息大数据计算服务及应用[J].电网技术,2015,39(11):3128-3133. 被引量：37
6邱剑,王慧芳,应高亮,张波,邹国平,何奔腾.文本信息挖掘技术及其在断路器全寿命状态评价中的应用[J].电力系统自动化,2016,40(6):107-112. 被引量：61
7曹靖,陈陆燊,邱剑,王慧芳,应高亮,张波.基于语义框架的电网缺陷文本挖掘技术及其应用[J].电网技术,2017,41(2):637-643. 被引量：83

共引文献104

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：54
2刘雨可,周申培,石英,杜家宝.面向配网一次设备缺陷文本命名实体识别研究[J].武汉理工大学学报,2022,44(10):93-101. 被引量：2
3吴漾,王鹏宇,缪新萍,柳林溪,田钺.基于改进深度强化学习算法的电网缺陷文本挖掘模型研究[J].科技通报,2021,37(2):47-55. 被引量：5
4陶洪铸,翟明玉,许洪强,季学纯,刘金波,徐丽燕.适应调控领域应用场景的人工智能平台体系架构及关键技术[J].电网技术,2020,44(2):412-419. 被引量：36
5姚学恒,张萍,闫立伟,操诚.基于机器学习的企业秘密文档自动分类方法[J].产业与科技论坛,2020,19(7):44-45.
6蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：216
7吕春.统计规律性的计算机模拟演示[J].工科物理,2000,10(4):46-51.
8朱龙珠,徐宏,刘莉莉.基于深度学习的95598重大服务事件识别研究[J].电力信息与通信技术,2018,16(11):19-23. 被引量：12
9闪鑫,陆晓,翟明玉,高宗和,徐春雷,滕贤亮,王波.人工智能应用于电网调控的关键技术分析[J].电力系统自动化,2019,43(1):49-57. 被引量：124
10唐瑞伟,栗薇,张震,刘津,高原.基于大数据分析的10 kV配网停电作业时长预测优化研究[J].电力大数据,2019,22(1):27-34. 被引量：3

同被引文献13

1邓一贵,伍玉英.基于文本内容的敏感词决策树信息过滤算法[J].计算机工程,2014,40(9):300-304. 被引量：32
2高楠,赵蕴华,彭鼎原.基于引用关系与词汇分析法的研究前沿识别研究——以人工智能领域为例[J].情报杂志,2020,39(4):44-50. 被引量：15
3陈可嘉,郑晶晶.基于改进的卷积记忆神经网络的文本情感分类[J].武汉理工大学学报（信息与管理工程版）,2020,42(1):86-92. 被引量：3
4李婷,秦永彬,黄瑞章,程欣宇,陈艳平.基于神经网络的中文谓语动词识别研究[J].数据采集与处理,2020,35(3):582-590. 被引量：8
5汪少敏,王铮,任华.利用深度学习融合模型提升文本内容安全的研究[J].电信科学,2020,36(5):25-30. 被引量：10
6潘旭东,张谧,颜一帆,陆逸凡,杨珉.通用深度学习语言模型的隐私风险评估[J].计算机研究与发展,2021,58(5):1092-1105. 被引量：5
7吴珊,李英祥,徐鸿雁,张仕霞,施宜军.基于改进的Trie树和DFA的敏感词过滤算法[J].计算机应用研究,2021,38(6):1678-1682. 被引量：13
8张玉洁,白如江,刘明月,于纯良.融合语义联想和BERT的图情领域SAO短文本分类研究[J].图书情报工作,2021,65(16):118-129. 被引量：11
9周育忠,陶秀杰,张自锋,韦嵘晖,杨宇亮.基于信息熵模型的电力主题词库特征自动提取[J].自动化技术与应用,2021,40(8):90-94. 被引量：2
10喻波,王志海,孙亚东,谢福进,安鹏.非结构化文档敏感数据识别与异常行为分析[J].智能系统学报,2021,16(5):931-939. 被引量：10

引证文献1

1周军芽,吴进伟,吴广飞,张何为.基于Bi-LSTM神经网络的短文本敏感词识别方法[J].武汉理工大学学报（信息与管理工程版）,2024,46(2):312-316. 被引量：1

二级引证文献1

1邓又琦,张明,马敬济.基于深度学习识别算法的文件敏感词多维度检测技术研究[J].计算机与数字工程,2024,52(8):2435-2439.

1Mingtao SUN,Xiaowei ZHAO,Jingjing LIN,Jian JING,Deqing WANG,Guozhu JIA.PSLDA:a novel supervised pseudo document-based topic model for short texts[J].Frontiers of Computer Science,2022,16(6):71-80.
2Weidong Sun,Charles H.Langmuir,Neil M.Ribe,Lipeng Zhang.Reply to "Is‘plume interaction induced migration of the Hawaiian-Emperor Seamounts’a step too far?"[J].Science Bulletin,2022,67(12):1221-1223.
3曹泽麟,徐君,董振华,文继荣.基于多任务学习的位置倾向性得分预测算法[J].计算机研究与发展,2023,60(1):85-94. 被引量：1
4Yaocheng Li,Yongpeng Xu,Mingkai Xu,Siyuan Wang,Zhicheng Xie,Zhe Li,Xiuchen Jiang.Automatic infrared image recognition method for substation equipment based on a deep self-attention network and multi-factor similarity calculation[J].Global Energy Interconnection,2022,5(4):397-408.
5闫晗.“乌卡”与2023[J].今日工程机械,2022(6):4-4.
6周向隅.在课堂上祈祷[J].英语画刊（高级）,2022(29):15-15.
7Qixin Lan,Binqiang Chen,Bin Yao.A Novel Motor Fault Diagnosis Method Based on Generative Adversarial Learning with Distribution Fusion of Discrete Working Conditions[J].Computer Modeling in Engineering & Sciences,2023(8):2017-2037.
8引用文献格式样例[J].英语教师,2022,22(19):191-191.
9Jianye Liu,Yiqiao Zhang.Health status and health disparity in China:a demographic and socioeconomic perspective[J].China Population and Development Studies,2019,2(1):301-322. 被引量：1

Wuhan University Journal of Natural Sciences

2022年第6期

浏览历史

内容加载中请稍等...