融合词语信息的细粒度命名实体识别

FINE-GRAINED NAMED ENTITY RECOGNITION BASED ON WORDS INFORMATION

下载PDF

导出

摘要针对基于字级别的命名实体识别方法无法充分利用句子词语信息的问题,提出一种融合词语信息的细粒度命名实体识别模型。该模型通过引入外部词典,在基于字表示中融入句子潜在词语的信息,避免了分词错误传播的问题,同时构建了一种增强型字向量表达;利用扁平化的Lattice Transformer网络结构对字和词语的表示以及位置关系信息进行建模;通过CRF(Conditional Random Filed)计算得到最优标签序列。在细粒度命名实体语料CLUENER2020上进行了实验,精确率达到82.46%,召回率达到83.14%,F1值达到82.80%,验证了融合词语信息可以提升细粒度命名实体识别效果。 Aiming at the problem that the character-level named entity recognition method cannot make full use of the words information in the sentence,we propose a fine-grained named entity recognition model that integrates words information.By introducing an external lexicon,the model incorporated the information of potential words in the character-based representation,avoiding the propagation of words segmentation error,and an enhanced word vector expression was constructed.Using the flat lattice transformer network structure to model the characters representation,the words representation and the position relationship information.The optimal tag sequence was calculated by conditional random filed(CRF).The experiments were conducted on the fine-grained named entity corpus CLUENER2020.The results show that the accuracy rate reaches 82.46%,the recall rate reaches 83.14%,and F1 value reaches 82.80%,which verifies that the fusion of word information can improve the effect of fine-grained named entity recognition.

作者曹晖徐杨 Cao Hui;Xu Yang(School of Big Data and Information Engineering,Guizhou University,Guiyang 550025,Guizhou,China;Guiyang Aluminum Magnesium Design&Research Institute Co.,Ltd.,Guiyang 550081,Guizhou,China)

机构地区贵州大学大数据与信息工程学院贵阳铝镁设计研究院有限公司

出处《计算机应用与软件》北大核心 2023年第3期235-240,共6页 Computer Applications and Software

基金贵州省科技计划项目(黔科合LH字[2016]7429号) 贵州大学引进人才项目(2015- 12)。

关键词词语信息细粒度实体识别扁平化Lattice TRANSFORMER BERT Words information Fine-grained entity recognition Flat lattice transformer BERT

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1李明扬,孔芳.融入自注意力机制的社交媒体命名实体识别[J].清华大学学报（自然科学版）,2019,59(6):461-467. 被引量：45
2刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：149
3王子牛,姜猛,高建瓴,陈娅先.基于BERT的中文命名实体识别方法[J].计算机科学,2019,46(S11):138-142. 被引量：91
4杨飘,董文永.基于BERT嵌入的中文命名实体识别方法[J].计算机工程,2020,46(4):40-45. 被引量：102
5徐凯,王崎,李振彰,康培培,谢峰,刘文印.基于结合多头注意力机制BiGRU网络的生物医学命名实体识别[J].计算机应用与软件,2020,37(5):151-155. 被引量：8

二级参考文献35

1陈治纲,何丕廉,孙越恒,郑小慎.基于向量空间模型的文本分类系统的研究与实现[J].中文信息学报,2005,19(1):36-41. 被引量：43
2张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：66
3孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
4向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
5刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
6俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：157
7周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
8张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006,28(6):135-139. 被引量：20
9洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
10冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):104-110. 被引量：24

共引文献347

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
2屈丹丹,杨涛,朱垚,胡孔法.基于字向量的BiGRU-CRF肺癌医案四诊信息实体抽取研究[J].世界科学技术-中医药现代化,2021,23(9):3118-3125. 被引量：6
3张敏杰,徐宁,胡俊华,王宇飞,李晨,徐剑波,张诗玉.面向变压器智能运检的知识图谱构建和智能问答技术研究[J].全球能源互联网,2020,3(6):607-617. 被引量：13
4步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
5徐道柱,金澄,马超,焦洋洋,许剑.基于BERT-BiGRU-CRF与多头注意力机制的地理命名实体识别[J].网络安全与数据治理,2023,42(S01):169-173. 被引量：1
6李书琴,张明美,刘斌.融合字词语义信息的猕猴桃种植领域命名实体识别研究[J].农业机械学报,2022,53(12):323-331. 被引量：5
7刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
8陆晓蕾,倪斌.基于预训练语言模型的BERT-CNN多层级专利分类研究[J].中文信息学报,2021,35(11):70-79. 被引量：19
9李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：19
10张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：12

1倪健,陈鹏兴.基于Bert-BiLSTM-Attention的互联网金融实体识别方法[J].信息与电脑,2021,33(20):58-61. 被引量：1
2刘继明,孙成,袁野.基于训练模型改进的语音问句信息抽取方法[J].科学技术与工程,2021,21(18):7635-7641. 被引量：3
3杨俊铄,戴宁,田素坤,俞青,程筱胜.利用三维深度神经网络提取个性化牙弓线[J].计算机辅助设计与图形学学报,2022,34(5):811-820. 被引量：1
4王燕,赵妮妮,范林.基于图神经网络特征交叉的协同过滤算法[J].兰州理工大学学报,2023,49(1):94-102.

计算机应用与软件

2023年第3期

浏览历史

内容加载中请稍等...

融合词语信息的细粒度命名实体识别

参考文献5

二级参考文献35

共引文献347

相关作者

相关机构

相关主题

浏览历史