期刊文献+

基于新词发现和Lattice-LSTM的中文医疗命名实体识别 被引量:8

CHINESE MEDICAL NAMED ENTITY RECOGNITION BASED ON NEW WORD DISCOVERY AND LATTICE-LSTM
下载PDF
导出
摘要 在医疗命名实体识别中,由于存在大量医学专业术语和语料中语言不规范的原因,识别的准确率不高。为了识别未登录的医学术语和应对语言不规范问题,提出一种基于N-grams新词发现的Lattice-LSTM的多粒度命名实体识别模型。在医疗对话语料中使用N-grams算法提取新词并构造一个医疗相关的词典,通过Lattice-LSTM模型将输入的字符和所有能在词典匹配的单词一起编码,其中门结构能够使模型选择最相关的字符和单词。Lattice-LSTM能够利用发现的新词信息识别未登录的医学术语,从而得到更好的实验识别结果。 In medical named entity recognition,the accuracy of recognition is not high because there are a large number of medical terms and non-standard language in corpus.In order to identify unregistered medical terms and deal with the problem of non-standard language,we propose a Lattice-LSTM multi-granularity named entity recognition model based on N-grams new words discovery.The N-grams algorithm was used to extract new words from medical conversation corpus and construct a medical-related dictionary.Lattice-LSTM model was used to encode the input characters together with all the words matched in the dictionary.The gate structure enabled the model to select the most relevant characters and words.Lattice-LSTM can use the information of new words to identify unregistered medical terms,so as to get better experimental recognition results.
作者 赵耀全 车超 张强 Zhao Yaoquan;Che Chao;Zhang Qiang(National and Local Joint Engineering Laboratory of Computer Aided Design,Dalian University,Dalian 116622,Liaoning,China)
出处 《计算机应用与软件》 北大核心 2021年第1期161-165,249,共6页 Computer Applications and Software
基金 国家自然科学基金项目(61751203) 大连市科技创新基金项目(2018J12GX036) 大连市高层次人才创新支持计划项目(2017RD11)。
关键词 医疗命名实体识别 N-GRAMS 新词发现 Lattice-LSTM Medical named entity recognition N-grams New word discovery Lattice-LSTM
  • 相关文献

参考文献2

二级参考文献8

  • 1邹纲,刘洋,刘群,孟遥,于浩,西野文人,亢世勇.面向Internet的中文新词语检测[J].中文信息学报,2004,18(6):1-9. 被引量:59
  • 2崔世起,刘群,孟遥,于浩,西野文人.基于大规模语料库的新词检测[J].计算机研究与发展,2006,43(5):927-932. 被引量:32
  • 3郑家恒 李文花.新词语自动识别方法研究.自然语言理解与机器翻译[M].北京:清华大学出版社,2001..
  • 4陆志苇.现代汉语构词法(修订本)[M].北京:中华书局,1975..
  • 5商务印书馆辞书研究中心.新华新词语词典[M].北京:商务印书馆,2003..
  • 6Li Hongqiao, Huang Changning, Gao Jianfeng, et al. The use of SVM for Chinese new word identification[C] // Processing of 2004 International Joint Conference on Natural Language. China:[s. n. ], 2004: 723-732.
  • 7Rakesh A, Tomasz I, Axun S. Mining association rules between sets of items in large database[C]//Proceedings of the ACM SIGMOD conference on Management of Data. Washington DC: ACM Press, 1993: 207-216.
  • 8段云峰,宋俊德,李剑威,舒华英.基于数量的关联规则挖掘[J].北京邮电大学学报,2002,25(4):56-60. 被引量:6

共引文献59

同被引文献51

引证文献8

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部