多粒度融合嵌入的中文实体识别模型被引量：6

Chinese Entity Recognition Model of Multi-granularity Fusion Embedded

下载PDF

导出

摘要中文由于词边界模糊,字符信息获取不足等问题,使得中文实体识别较为困难.论文针对汉字的象形文字特点,提出一种结合字形特征的增强字符信息算法,该算法利用卷积神经网络和BERT模型得到增强字符向量;同时提出多粒度融合嵌入算法,利用注意力机制将增强字符向量与词向量融合,最终构建出多粒度融合嵌入的中文实体识别模型.实验表明,该模型在中文实体识别中优于其它常用模型. Chinese entity recognition is difficult due to fuzzy word boundary and insufficient character information acquisition.In view of the hieroglyphic character characteristics of Chinese characters,paper proposes an enhanced character information algorithm combined with glyph characteristics.This algorithm uses convolutional neural network and BERT model to obtain the enhanced character vector.At the same time,a multi-granularity fusion embedding algorithm is proposed,which uses the attention mechanism to fuse the enhanced character vector and word vector,and finally constructs the multi-granularity fusion embedding Chinese entity recognition model.Experiments show that this model is superior to other common models in Chinese entity recognition.

作者袁健章海波 YUAN Jian;ZHANG Hai-bo(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)

机构地区上海理工大学光电信息与计算机工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2022年第4期741-746,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61775139)资助。

关键词卷积神经网络 BERT 注意力机制命名实体识别 convolutional neural networks BERT attention name entity recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1冯蕴天,张宏军,郝文宁,陈刚.基于深度信念网络的命名实体识别[J].计算机科学,2016,43(4):224-230. 被引量：14
2冯艳红,于红,孙庚,孙娟娟.基于BLSTM的命名实体识别方法[J].计算机科学,2018,45(2):261-268. 被引量：51
3殷章志,李欣子,黄德根,李玖一.融合字词模型的中文命名实体识别研究[J].中文信息学报,2019,33(11):95-100. 被引量：41

二级参考文献29

1俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：157
2Tjong K,Sang E F,De Meulder F.Introduction to the CoNLL-2003 shared task:Language-independent named entity recognition[C]∥Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL 2003-Volume 4.Association for Computational Linguistics,2003:142-147.
3McCallum A,Li W.Early results for named entity recognitionwith conditional random fields,feature induction and web-enhanced lexicons[C]∥Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL 2003-Volume 4.Association for Computational Linguistics,2003:188-191.
4Wang Zhi-qiang.Research on Chinese named entity recognition based on conditional random fields[D].Nanjing:Nanjing University of Science and Technology,2006(in Chinese).
5Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
6Hinton G,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.
7Nadeau D,Sekine S.A survey of named entity recognition and classification[J].Lingvisticae Investigationes,2007,30(1):3-26.
8Hinton G E.Learning distributed representations of concepts[C]∥Proceedings of the Eighth Annual Conference of the Cognitive Science Cociety.1986,1:12.
9Wang M,Manning C D.Effect of non-linear deep architecture in sequence labeling[C]∥Proceedings of the 6th International Joint Conference on Natural Language Processing (IJCNLP).2013.
10Mansur M,Pei W,Chang B.Feature-based Neural LanguageModel and Chinese Word Segmentation[C]∥ International Joint Conference on Natural Language Processing.2013:1271-1277.

共引文献100

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
3孙红,王哲.多粒度融合的命名实体识别[J].中文信息学报,2023,37(3):123-134.
4成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
5程宁,李斌,葛四嘉,郝星月,冯敏萱.基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究[J].中文信息学报,2020(4):1-9. 被引量：21
6王德文,雷倩.基于贝叶斯正则化深度信念网络的电力变压器故障诊断方法[J].电力自动化设备,2018,38(5):129-135. 被引量：48
7王东波,胡昊天,周鑫,朱丹浩.基于深度学习的数据科学招聘实体自动抽取及分析研究[J].图书情报工作,2018,62(13):64-73. 被引量：15
8高强,王明.深度信念网络的等效模型及权值扩展算法研究[J].电测与仪表,2017,54(23):54-59.
9于红,戚浩然,苏延明,刘海映,张思佳,程名,卢晓黎,穆晓辉.海洋渔业标准化在线信息集成服务与推广平台关键技术分析[J].海洋信息,2018,33(4):33-38. 被引量：6
10黄晴雁,牟永敏.命名实体识别方法研究进展[J].现代计算机（中旬刊）,2018(12):12-17. 被引量：4

同被引文献42

1黄伟.汉字简化中的字形复杂度统计特征稳定性研究[J].语言文字应用,2021(1):53-64. 被引量：4
2李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
3王铭涛,方晔玮,陈文亮.基于中文字形的ELMo在电商事件识别上的应用[J].中文信息学报,2021,35(12):94-102. 被引量：4
4苏祺,胡韧奋,诸雨辰,严承希,王军.古籍数字化关键技术评述[J].数字人文研究,2021,1(3):83-88. 被引量：14
5乐娟,赵玺.基于HMM的京剧机构命名实体识别算法[J].计算机工程,2013,39(6):266-271. 被引量：17
6李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：29
7黄水清,王东波.古文信息处理研究的现状及趋势[J].图书情报工作,2017,61(12):43-49. 被引量：31
8刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：149
9郑彦斌,夏志超,郭智,黄永忠,刘文芬.东盟十国新闻文本的命名实体识别[J].科学技术与工程,2018,18(35):162-168. 被引量：8
10何彬,关毅.基于字级别条件随机场的医学实体识别[J].智能计算机与应用,2019,9(2):130-134. 被引量：6

引证文献6

1张朦,刘忠宝.数字人文环境下融入多特征的词命名实体识别[J].计算机系统应用,2023,32(3):300-308.
2蒋丽媛,吴亚东,王书航,张巍瀚,李懿.融合笔画特征的命名实体识别方法[J].科学技术与工程,2023,23(17):7436-7443. 被引量：2
3夏成魁,李少波.基于BERT-BiLSTM-MHA-CRF的中文命名实体识别方法[J].计算机与数字工程,2023,51(9):2087-2091.
4邱云飞,邢浩然,于智龙,张文文.面向矿山机电设备监测文本的命名实体识别[J].计算机工程与应用,2024,60(11):129-138.
5占文韬,吴晓鸰,凌捷.基于多窗口注意力机制的中文命名实体识别[J].小型微型计算机系统,2024,45(6):1325-1330. 被引量：1
6肖蕾,陈镇家.数据驱动的中文实体抽取方法综述[J].计算机工程与应用,2024,60(16):34-48.

二级引证文献3

1郝宽公,董兵,吴悦,彭自琛,罗创.基于BERT-Bi-LSTM-CRF模型的机场类中文航行通告要素实体识别[J].科学技术与工程,2024,24(10):4182-4188. 被引量：1
2王昕,魏楚元,张蕾,万珊珊.提示学习框架下融合多层级特征信息的中文命名实体识别[J].数据采集与处理,2024,39(4):1020-1032.
3邓健志,方雨桐,杨燕.基于ChineseBERT的中文知识图谱问答方法[J].科学技术与工程,2024,24(23):9947-9956.

1张厚昌,刘成良.融合嵌入字词特征的中文医疗命名实体识别[J].中华医学图书情报杂志,2021,30(9):42-49. 被引量：5
2赵肖华,马志超,周娜.基于价值链的钢铁企业业财融合研究[J].河北冶金,2022(2):70-73. 被引量：3
3潘慧慧.业财融合嵌入企业内部控制体系的应用研究[J].纳税,2021,15(19):177-178. 被引量：13
4饶东宁,何展鹏.基于知识库标记预训练孪生神经网络的中文实体链接[J].计算机科学与应用,2022,12(4):1202-1212.
5姬艳涛.党史视角下“枫桥经验”生成的逻辑理路[J].浙江警察学院学报,2021,33(6):20-31. 被引量：2
6丁增稳,郑兴东,张之君.基于业财融合模式的企业内部控制研究[J].金融理论与教学,2022(1):62-65. 被引量：11
7苏树智,谢军,平昕瑞,高鹏连.图强化典型相关分析及在图像识别中的应用[J].电子与信息学报,2021,43(11):3342-3349. 被引量：6
8葛红蕾.应用业财融合提升全面预算管理质量的思考[J].会计师,2021(23):34-35. 被引量：4
9王丹阳,朴雨瑶.论大学生语言素养提升与实践在水利工程专业教学中的作用分析——评《水利工程管理》[J].灌溉排水学报,2022,41(2):151-151. 被引量：1
10张振谦.国之公戈考[J].汉字汉语研究,2022(1):24-29. 被引量：1

小型微型计算机系统

2022年第4期

浏览历史

内容加载中请稍等...

多粒度融合嵌入的中文实体识别模型被引量：6

参考文献3

二级参考文献29

共引文献100

同被引文献42

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

多粒度融合嵌入的中文实体识别模型 被引量：6

参考文献3

二级参考文献29

共引文献100

同被引文献42

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

多粒度融合嵌入的中文实体识别模型被引量：6