基于知识增强的中文命名实体识别被引量：12

Chinese Named Entity Recognition Based on Knowledge Enhancement

下载PDF

导出

摘要基于字词联合的中文命名实体识别模型能够兼顾字符级别与词语级别的信息,但受未登录词影响较大且在小规模数据集上存在训练不充分等问题。在现有LR-CNN模型的基础上,提出一种结合知识增强的中文命名实体识别模型,采用相对位置编码的多头注意力机制提高模型上下文信息捕捉能力,通过实体词典融入先验知识降低未登录词的影响并增强模型学习能力。实验结果表明,该模型在保持较快解码速度和较低计算资源占用量的情况下,在MSRA、People Daily、Resume、Weibo数据集上相比SoftLexicon、FLAT等模型F1值均有明显提升,同时具有较强的鲁棒性和泛化能力。 Chinese Named Entity Recognition(CNER)models can capture both character-level and word-level information,but are vulnerable to the negative impact of Out-of-Vocabulary(OOV)words and insufficient training caused by small datasets.To address this problem,an additional knowledge enhanced CNER model is proposed based on the LR-CNN model.The model uses the multi-head attention mechanism with relative position embedding to improve the ability of the model to capture contextual information.Additionally,the entity dictionary is used to add prior knowledge to reduce the impact of OOV words,and to enhance the generalization ability of the model.Experimental results show that compared with SoftLexicon,FLAT and other models on the MSRA,People Daily,Resume,Weibo datasets,the F1 value has significantly improved.It displays excellent robustness and generalization ability.

作者胡新棒于溆乔李邵梅张建朋 HU Xinbang;YU Xuqiao;LI Shaomei;ZHANG Jianpeng(Institute of Information Technology,PLA Strategic Support Force Information Engineering University,Zhengzhou 450003,China;The University of Melbourne,Melbourne 3010,Australia)

机构地区中国人民解放军战略支援部队信息工程大学信息技术研究所墨尔本大学

出处《计算机工程》 CAS CSCD 北大核心 2021年第11期84-92,共9页 Computer Engineering

基金国家自然科学基金青年基金(62002384) 国家重点研发计划(2016QY03D0502) 郑州市协同创新重大专项(162/32410218)。

关键词中文命名实体识别注意力机制知识增强未登录词小规模数据集 Chinese Named Entity Recognition(CNER) attention mechanism knowledge enhancement Out-of-Vocabulary(OOV)word small-scale dataset

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1温秀秀,马超,高原原,康子路.基于标签聚类的中文重叠命名实体识别方法[J].计算机工程,2020,46(5):41-46. 被引量：6
2张若彬,刘嘉勇,何祥.基于BLSTM-CRF模型的安全漏洞领域命名实体识别[J].四川大学学报（自然科学版）,2019,56(3):469-475. 被引量：16

二级参考文献15

1张玥杰,徐智婷,薛向阳.融合多特征的最大熵汉语命名实体识别模型[J].计算机研究与发展,2008,45(6):1004-1010. 被引量：33
2郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明.基于层叠条件随机场的旅游领域命名实体识别[J].中文信息学报,2009,23(5):47-52. 被引量：37
3滕青青,吉久明,郑荣廷,李楠.基于文献的中文命名实体识别算法适用性分析研究[J].情报杂志,2010,29(9):157-161. 被引量：9
4谭永兴,罗军勇,尹美娟.Markov逻辑网及其在信息抽取中的应用[J].计算机工程,2012,38(18):162-165. 被引量：2
5张传岩,洪晓光,彭朝晖,李庆忠.基于SVM和扩展条件随机场的Web实体活动抽取[J].软件学报,2012,23(10):2612-2627. 被引量：15
6杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[J].自动化学报,2014,40(8):1537-1562. 被引量：127
7冯蕴天,张宏军,郝文宁.面向军事文本的命名实体识别[J].计算机科学,2015,42(7):15-18. 被引量：50
8杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰.中文电子病历命名实体和实体关系语料库构建[J].软件学报,2016,27(11):2725-2746. 被引量：106
9杨可心,桑永胜.基于BP神经网络的DDoS攻击检测研究[J].四川大学学报（自然科学版）,2017,54(1):71-75. 被引量：18
10王红斌,沈强,线岩团.融合迁移学习的中文命名实体识别[J].小型微型计算机系统,2017,38(2):346-351. 被引量：24

共引文献20

1姜淑杨,鲍磊磊,缪明榕.计算机网络安全漏洞及其管理研究[J].电子元器件与信息技术,2019,0(7):14-17. 被引量：4
2黄炜,黄建桥,李岳峰.基于BiLSTM-CRF的涉恐信息实体识别模型研究[J].情报杂志,2019,38(12):149-156. 被引量：24
3许丽丹,刘嘉勇,何祥.一种解决命名实体识别数据集类别标记失衡的方法[J].四川大学学报（自然科学版）,2020,57(1):82-88. 被引量：6
4侯丽仙,李艳玲,林民,李成城.融合多约束条件的意图和语义槽填充联合识别[J].计算机科学与探索,2020,14(9):1545-1553. 被引量：7
5余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：18
6李涛,郭渊博,琚安康.融合对抗主动学习的网络安全知识三元组抽取[J].通信学报,2020,41(10):80-91. 被引量：7
7廉龙颖.Bi-LSTM+CRF的网络空间安全领域命名实体的识别[J].黑龙江科技大学学报,2020,30(6):717-722. 被引量：4
8林若钦,罗琼.基于可变形卷积神经网络的软件漏洞检测算法[J].计算机仿真,2021,38(3):405-409. 被引量：5
9吴天波,刘露平,罗晓东,卿粼波,何小海.基于弱依赖信息的知识库问答方法[J].计算机工程,2021,47(6):76-82. 被引量：4
10菊花,那顺乌日图.基于数据库的专业术语知识图谱自动识别设计[J].现代电子技术,2021,44(14):129-132.

同被引文献101

1王蓬辉,李明正,李思.基于数据增强的中文医疗命名实体识别[J].北京邮电大学学报,2020,43(5):84-90. 被引量：12
2俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：159
3胡文博,都云程,吕学强,施水才.基于多层条件随机场的中文命名实体识别[J].计算机工程与应用,2009,45(1):163-165. 被引量：25
4佘俊,张学清.音乐命名实体识别方法[J].计算机应用,2010,30(11):2928-2931. 被引量：8
5闫萍.基于规则和概率统计相结合的中文命名实体识别研究[J].计算机与数字工程,2011,39(9):88-91. 被引量：11
6潘正高.基于规则和统计相结合的中文命名实体识别研究[J].情报科学,2012,30(5):708-712. 被引量：29
7李凤华,苏铓,史国振,马建峰.访问控制模型研究进展及发展趋势[J].电子学报,2012,40(4):805-813. 被引量：128
8李杨,温雯,谢光强.差分隐私保护研究综述[J].计算机应用研究,2012,29(9):3201-3205. 被引量：40
9王洪亮.基于词向量聚类的中文微博产品命名实体识别[J].兰州理工大学学报,2017,43(1):104-110. 被引量：8
10房梁,殷丽华,郭云川,方滨兴.基于属性的访问控制关键技术研究综述[J].计算机学报,2017,40(7):1680-1698. 被引量：85

引证文献12

1靳姝婷,何泾沙,朱娜斐,潘世佳.基于本体推理的隐私保护访问控制机制研究[J].信息网络安全,2021(8):52-61. 被引量：2
2林振,秦宇辰,秦婴逸,李冬冬,吴骋,贺佳.基于缺血性脑卒中患者出院小结的协变量提取方法[J].第二军医大学学报,2021,42(11):1273-1278.
3葛志辉,洪龙翔,李陶深,叶进.融合动态掩码预训练与膨胀卷积的实体识别[J].广西大学学报（自然科学版）,2022,47(3):692-703. 被引量：1
4周祺,陶皖,孔超,崔佰婷.融合记忆网络的细粒度实体分类方法[J].计算机科学与探索,2022,16(11):2565-2574.
5张汝佳,代璐,郭鹏,王邦.基于分割注意力与边界感知的中文嵌套命名实体识别算法[J].计算机科学,2023,50(1):213-220. 被引量：3
6琚沅红,牟冬梅,王书童,李桦,徐静雯,吕淑贞.少样本高质量医学知识的命名实体识别研究——以肺癌诊疗规范为例[J].现代情报,2023,43(2):9-19. 被引量：6
7廖列法,谢树松.基于注意力机制特征融合的中文命名实体识别[J].计算机工程,2023,49(4):256-262. 被引量：5
8马永军,王野.基于LNBC模型的中文命名实体识别[J].天津科技大学学报,2023,38(2):50-55. 被引量：1
9王进,王猛旗,张昕跃,孙开伟,朴昌浩.基于多头注意力机制字词联合的中文命名实体识别[J].江苏大学学报（自然科学版）,2024,45(1):77-84.
10王磊,于洋,麦立,张传海,王今.基于循环神经网络的电力一次设备实体关系抽取模型研究[J].电子设计工程,2024,32(4):107-111.

二级引证文献19

1马龙飞,李香龙,陆斯悦,张禄.基于区块链技术的互联电动汽车隐私保护方法[J].信息网络安全,2021(S01):163-167. 被引量：4
2许皖秀,左晓栋.云平台数据保护与内容审核义务关系分析[J].信息安全研究,2022,8(11):1079-1084. 被引量：2
3梁维中,王淑涵,王洪玉.基于BERT预训练模型的镁合金铸造缺陷命名实体识别[J].黑龙江科技大学学报,2023,33(2):191-195.
4杨长沛,廖列法.基于门控空洞卷积特征融合的中文命名实体识别[J].计算机工程,2023,49(8):85-95. 被引量：6
5贾诗威,陈慧彤.剧变中的守正与创新:情报学的智慧与方案——2022年中国情报学年会暨情报学与情报工作发展论坛纪要[J].图书情报知识,2023,40(4):153-160. 被引量：2
6乐书豪.基于注意力阅读理解式的中文命名实体识别模型[J].信息与电脑,2023,35(10):16-18.
7宫昀.基于Transformer模型的神经机器翻译改进方法研究[J].自动化与仪器仪表,2023(8):257-261. 被引量：1
8郭顺利,苏新宁,房旭辉.融合NER和Apriori算法的游记文本关联知识挖掘及推荐服务研究[J].现代情报,2023,43(11):123-134. 被引量：1
9刘安栋,彭琳,叶青,杜建强,程春雷,查青林.电子病历命名实体识别研究进展[J].计算机工程与应用,2023,59(21):39-51. 被引量：3
10牟冬梅,琚沅红,于海涛,王书童.可计算生物医学知识视角下诊疗规范知识计算化模式研究[J].现代情报,2023,43(12):73-87.

1朱永清,赵鹏,赵菲菲,慕晓冬,白坤,尤轩昂.基于深度学习的生成式文本摘要技术综述[J].计算机工程,2021,47(11):11-21. 被引量：18
2廖涛,勾艳杰,张顺香.融合注意力机制的BERT-BiLSTM-CRF中文命名实体识别[J].阜阳师范大学学报（自然科学版）,2021,38(3):86-91. 被引量：7
3郑洪浩,于洪涛,李邵梅.基于改进的Transformer编码器的中文命名实体识别[J].网络与信息安全学报,2021,7(5):105-112. 被引量：2
4Cotton market fundamentals & price outlook, AUGUST 2021[J].China Textile,2021(5):40-41.
5Patrick L.Osewe,Nansubuga Nagadya Isdahl.Revive the Economy and Resume Travel in Asia and the Pacific[J].China's Foreign Trade,2021(5):18-19.
6Muhammad Zubair Mohsin,Rabia Omer,Jiaofang Huang,Ali Mohsin,Meijin Guo,Jiangchao Qian,Yingping Zhuang.Advances in engineered Bacillus subtilis biofilms and spores, and their applications in bioremediation, biocatalysis, and biomaterials[J].Synthetic and Systems Biotechnology,2021,6(3):180-191. 被引量：5

计算机工程

2021年第11期

浏览历史

内容加载中请稍等...

基于知识增强的中文命名实体识别被引量：12

参考文献2

二级参考文献15

共引文献20

同被引文献101

引证文献12

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于知识增强的中文命名实体识别 被引量：12

参考文献2

二级参考文献15

共引文献20

同被引文献101

引证文献12

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于知识增强的中文命名实体识别被引量：12