目前火灾事故报告都是以文本形式存在,有关火灾事故的经验知识则蕴含在非结构化的文本中,应急主体要获得经验知识,保证应急决策中的方案更精确,依靠人工对文本进行抽取,将耗费较高的成本.本文提出了基于分句模型的燃烧物关键词的抽取方...目前火灾事故报告都是以文本形式存在,有关火灾事故的经验知识则蕴含在非结构化的文本中,应急主体要获得经验知识,保证应急决策中的方案更精确,依靠人工对文本进行抽取,将耗费较高的成本.本文提出了基于分句模型的燃烧物关键词的抽取方法,抽取出燃烧物描述的句子,并采用双向长短期记忆(BILSTM,BI-DIRECTIONAL LONG SHORT TERM MEMORY)神经网络,结合注意力(ATTENTION)机制构建句子级的燃烧物抽取模型,对句子中描述的燃烧物进行处理,最后得到燃烧物的向量.通过实验研究了分句与全文两种状态下,转换成词向量后分别输入LSTM、LSTM+Attention、BiLSTM+Attention和支持向量机(support vector machines,SVM)等四个模型进行燃烧物抽取,对抽取结果进行预测准确率、F1值宏平均、Precision值宏平均和Recall值宏平均四个指标对比,证实了分句模型的优越性和基于BILSTM结合ATTENTION机制框架模型的正确性.展开更多
文摘目前火灾事故报告都是以文本形式存在,有关火灾事故的经验知识则蕴含在非结构化的文本中,应急主体要获得经验知识,保证应急决策中的方案更精确,依靠人工对文本进行抽取,将耗费较高的成本.本文提出了基于分句模型的燃烧物关键词的抽取方法,抽取出燃烧物描述的句子,并采用双向长短期记忆(BILSTM,BI-DIRECTIONAL LONG SHORT TERM MEMORY)神经网络,结合注意力(ATTENTION)机制构建句子级的燃烧物抽取模型,对句子中描述的燃烧物进行处理,最后得到燃烧物的向量.通过实验研究了分句与全文两种状态下,转换成词向量后分别输入LSTM、LSTM+Attention、BiLSTM+Attention和支持向量机(support vector machines,SVM)等四个模型进行燃烧物抽取,对抽取结果进行预测准确率、F1值宏平均、Precision值宏平均和Recall值宏平均四个指标对比,证实了分句模型的优越性和基于BILSTM结合ATTENTION机制框架模型的正确性.