-
题名基于Bigram的安全隐患文本分类研究
被引量:10
- 1
-
-
作者
陈孝慈
谭章禄
单斐
高青
-
机构
中国矿业大学(北京)管理学院
-
出处
《中国安全科学学报》
CAS
CSCD
北大核心
2017年第8期156-161,共6页
-
基金
国家自然科学基金资助(61471362)
-
文摘
鉴于传统文本分类研究缺少针对性,在安全隐患文本分类实际应用中表现不佳,以及企业安全隐患文本文本长度短、特征单元选取困难,为高效地从大量安全隐患文本数据中提取、分析有效信息,更好地掌握安全隐患的发生和变化过程,提出利用Bigram二字串作为特征单元,结合支持向量机(SVM)数据挖掘算法的安全隐患文本分类方法。以潞安集团司马煤业有限公司2009—2015年安全隐患记录为数据源,通过试验,验证该方法的分类效果。结果表明:新的安全隐患分类方法具有较高的准确率、召回率及F-值,与传统方法相比,显著提升了分类的准确度。
-
关键词
安全隐患
bigram二字串
特征单元
支持向量机(SVM)
文本分类
-
Keywords
hidden danger
bigram
feature unit
support vector machine(SVM)
text categorization
-
分类号
X915.1
[环境科学与工程—安全科学]
-