-
题名基于BLS的铁路安全事件文本分类研究
被引量:2
- 1
-
-
作者
尚麟宇
尹明
肖畅
程君
-
机构
中国铁道科学研究院集团有限公司通信信号研究所
国能朔黄铁路发展有限责任公司
中国铁道学会
-
出处
《中国安全科学学报》
CAS
CSCD
北大核心
2022年第6期103-108,共6页
-
基金
国能集团科技创新项目(GJNY-20-231)
中国铁道科学研究院集团有限公司科研项目(2020YJ044)。
-
文摘
为预防铁路安全事件的发生,利用文本挖掘相关技术和宽度学习系统(BLS),探讨铁路安全事件分类,包括设备问题、施工问题、作业问题、外部环境问题4大类。通过清洗及结构化314条文本数据,运用Jieba分词+自定义词表+通用停用词表完成中文分词;基于卡方检验建立223个特征词,基于词频-逆文档频率(TF-IDF)计算特征词权重;基于BLS完成事件成因分类,设计3种基于BLS的分类方法。结果表明:该系统通过挖掘铁路安全事件报告的文本信息,能够形成有效的分类模型;利用BLS自身节省算力的特性,并通过添加特征增强节点的方式,可提高分类准确性,从而提高行业管理水平。
-
关键词
宽度学习系统(BLS)
铁路安全事件
文本分类
词频-逆文档频率(TF-IDF)
文本挖掘
-
Keywords
broad learning system(BLS)
railway safety incident
text classification
term frequency-inverse document frequency(TF-IDF)
text mining
-
分类号
X928
[环境科学与工程—安全科学]
-