-
题名基于文本挖掘的高速铁路动车组故障多级分类研究
被引量:3
- 1
-
-
作者
高凡
李樊
张铭
王志飞
赵俊华
-
机构
中国铁道科学研究院研究生部
中国铁道科学研究院集团有限公司
北京经纬信息技术有限公司
-
出处
《计算机测量与控制》
2020年第7期59-63,共5页
-
基金
国家自然科学基金(51967010)
铁科院集团公司重点课题(2019YJ115)
+1 种基金
铁科院集团公司青年课题(2019YJ125)
中国国家铁路集团有限公司科研专项课题(J2019X005)。
-
文摘
针对高速铁路信号设备故障发生后记录的文本数据,提出基于文本挖掘方式的高速铁路信号设备故障多级分类模型研究;提出TF-IDF词汇权重与词汇字典结合的特征表示方法实现信号设备故障文本数据的特征提取;多级分类模型中,基于Stacking集成学习思想设计单层分类模型,将循环神经网络BiGRU和BiLSTM作为初级学习器,设计权重组合计算方法作为次级学习器,将多级分类任务分解为各层单分类任务,并采用K折交叉验证训练Stacking模型;采用高速铁路自开通至十年的信号转辙机故障数据,通过对故障原因文本数据的分析,实现故障部位和故障原因的二级分类,经过K=5次训练,BiGRU较BiLSTM各评价指标都较高,经实验BiGRU分配权重为0.7,BiLSTM权重为0.3,组合加权对两个网络的输出计算,准确率提高为0.881 4,召回率提高为0.864 2;实验表明多级分类模型能够有效提升信号设备故障多级分类任务的分类评价指标,并能够保证分类结果隶属关系的正确性。
-
关键词
高速铁路信号设备
多级分类
Stacking集成学习
循环神经网络
多任务协作投票决策树
-
Keywords
high-speed railway signal equipment
multilevel classification
stacking integrated learning
recurrent neural network
multi-task collaborative voting decision tree
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-