-
题名道路交通事故信息文本预处理技术研究与实践
被引量:3
- 1
-
-
作者
张坤
梅诗冬
景国勋
西田佳史
三上喜贵
-
机构
河南理工大学安全科学与工程学院
日本长冈技术科学大学原子能系统安全工程系
安阳工学院
日本国家产业技术综合研究所人工智能研究中心
-
出处
《安全与环境工程》
CAS
2017年第4期112-116,122,共6页
-
基金
国家自然科学基金项目(51474098)
日本学术振兴会(JSPS)特别研究员奖励费基金项目(JP26-04306)
河南理工大学博士基金项目(B2013-008)
-
文摘
文本预处理是文本挖掘的关键一步,建立与信息相匹配的标准语义集合能缩短信息处理的时间,提高信息的提取率和识别精度。根据国家交通事故信息采集规范要求,从国家公共安全行业标准中抽取相关交通事故基本信息的标准词汇及代码,构建了一套含有12个属性项目、185个标准词汇的交通事故信息文本预处理用标准化语义集合,并将其应用于国家安全生产监督管理总局的事故查询系统,对系统中2004—2014年期间所收集的8 156件重大道路交通事故信息中的文本数据进行分析。结果表明:利用这套语义集合能更多地提取交通事故信息,可为准确捕捉交通事故特征和研究交通事故发生机理提供重要依据,也为开发交通事故自动信息识别系统创造了重要的条件。
-
关键词
文本预处理
交通事故信息
语义集合
数据挖掘
文本数据
-
Keywords
text preprocessing
traffic accident information
vocabulary set
data mining
narrative text
-
分类号
X913.4
[环境科学与工程—安全科学]
X951
[环境科学与工程—安全科学]
-