摘要
命名实体识别是自然语言处理的一个重要基础任务。传统基于统计学习模型的命名实体识别方法严重依赖特征工程,特征设计需要大量人工参与和专家知识,而且已有的方法通常大多将中文命名实体识别任务看作一个字符序列标注问题,需要依赖局部字符标记区分实体边界。为了减弱系统对人工特征设计的依赖,避免字符序列化标注方法的不足,该文对基于神经网络的片段级中文命名实体识别方法进行探索研究。通过采用深度学习片段神经网络结构,实现特征的自动学习,并通过获取片段信息对片段整体分配标记,同时完成实体边界识别和分类。基于神经网络的片段级中文命名实体识别方法在MSRA数据集上对人名、地名和机构名识别的总体F1值达到了90.44%。
Chinese Named Entity Recognition(NER)is an important task for Chinese information processing.In this paper,we explores the segmental neural architectures for Chinese NER,by regarding the task as a joint segmentation and labelling problem.The proposed methods can learn the effective segment-level representation and contextual information and then assign tags to the segments.The experimental results on MSRA corpus show that our method can achieve comparable performance with the state-of-the-art systems for Chinese NER and the F1 value gets90.44%.
作者
王蕾
谢云
周俊生
顾彦慧
曲维光
WANG Lei;XIE Yun;ZHOU Junsheng;GU Yanhui;QU Weiguang(School of Computer Science and Technology, Nanjing Normal University,Nanjing, Jiangsu 210046, China)
出处
《中文信息学报》
CSCD
北大核心
2018年第3期84-90,100,共8页
Journal of Chinese Information Processing
基金
国家自然科学基金(61472191
61272221)
江苏省高校自然科学研究项目(15KJA420001)
福建省信息处理与智能控制重点实验室(闽江学院)开放基金(MJUKF201705)
山东省语言资源开发重点实验室开放课题(211180A41601)
关键词
深度学习
神经网络
片段级中文命名实体识别
deep learning
neural network
segment-level Chinese named entity recognition