摘要
文章针对水利工程施工安全隐患文本的智能分类、挖掘和排查方法进行研究,提出基于机器学习和自然语言处理的方法,实现安全隐患文本的自动分类和排查线索挖掘。首先,对安全隐患文本进行预处理,提取文本特征并采用随机森林模型将文本分类为10个类别;其次,利用词云图和词频统计方法展现安全隐患的管理要点;最后,利用序列相似度匹配算法和隐含狄利克雷分布模型,从原始隐患数据中找出包含高频安全隐患核心词的代表性隐患数据,作为隐患排查线索,指导安全管理实践。文章提出的方法可以有效地提高水利工程施工安全隐患文本的分类准确率,挖掘隐患文本中有价值的信息,缩小隐患排查的范围,提高水利工程安全管理的效率和水平。
出处
《企业科技与发展》
2023年第12期96-101,共6页
Sci-Tech & Development of Enterprise
基金
深圳市科技计划基础研究项目“智慧工厂中基于物联网的有毒气体扩散跟踪方法研究及应用”(JCYJ20190809145407809)
深圳市高等院校稳定支持计划项目“面向精准教学的物联网智能终端关键技术与应用研究”(20200829114939001)
深圳信息职业技术学院创新科研团队项目“视觉检测物联网工程技术研究与产业化应用团队”(TD2020E001)。