摘要
序列标注任务是利用模型将非结构化的文本序列进行提取,并完成模型的训练和预测。基于对条件随机场(condition random fi eld,CRF)和深度神经网络中长短期记忆网络(long short term memory,LSTM),提出了栈式双向的长短期记忆网络(stacked bidirectional long short term memory,Stack Bi-LSTM)和考虑语法结构的神经半马尔可夫条件随机场(neural semi-markov condition random fi eld,NSCRF)的Stack Bi-LSTM-NSCRF模型,本模型底层堆叠式的Bi-LSTM分为两层,下层用来对非结构化的文本进行分词,上层用来进行语块和命名实体的提取工作。顶层NSCRF用来对提取的特征添加限制,以此过滤掉不符合语法的语块和命名实体。通过对本模型进行训练,提高了F1测度,因此本模型对序列标注有很好的效果。
作者
宋功鹏
李阳
安新周
张熙
韩琮师
SONG Gongpeng;LI Yang;AN Xinzhou;ZHANG Xi;HAN CongShi
出处
《信息技术与信息化》
2022年第7期129-132,共4页
Information Technology and Informatization