基于自注意机制的中文医药命名实体识别算法研究

Research on Chinese Entity Recognition Algorithm Based on Self-attention Mechanism

下载PDF

导出

摘要由于中文语境的复杂性,存在语言边界不清晰、语境依赖、大量的近义词和一词多义等实体嵌套现象,直接套用英文语境中的先进模型效果不理想.针对中文医药词汇和语境的特点,在双向编码器表示预训练语言模型基础上引入自注意机制,结合BiLSTM+CRF模型进行中文命名实体识别,以增强词向量之间以及词向量内的字间关系.试验结果表明,本文模型在嵌套实体数据集上和非嵌套实体数据集上的F1值都较高,对中文医药语境具有较好的适应性. Recently,the emergence of ChatGPT model,a knowledge graph-based Q&A system,has attracted widespread attention.However,Chinese-based automatic Q&A systems are still in their early stages.Due to the complexity of the Chinese context,characterized by unclear language boundaries,context dependence,numerous synonyms,and the nesting of entities with multiple meanings,directly applying advanced models from English language contexts may not yield satisfactory results.To address the characteristics of Chinese medical vocabulary and context,this paper introduces a self-attention mechanism to the BILSTM+CRF model for Chinese named entity recognition,based on the pre-trained language model of bidirectional encoder representation(BERT).In order to enhance the word vectors as well as the inter-word relations of the word vectors.Experimental results demonstrate that the proposed model achieves high F1 values on both nested entity datasets and non-nested entity datasets,showing good adaptability to the Chinese medical context.

作者郑胜男柳圣鞠文慧钱文泉 ZHENG Shengnan;LIU Sheng;JU Wenhui;QIAN Wenquan(College of Computer Science and Software Engineering,Hohai Univercity,Nanjing210024,China;School of Computer Engineering,Nanjing Institute of Technology,Nanjing 211167,China)

机构地区河海大学计算机与软件学院南京工程学院计算机工程学院

出处《南京工程学院学报（自然科学版）》 2023年第4期37-40,共4页 Journal of Nanjing Institute of Technology(Natural Science Edition)

关键词知识图谱问答系统实体抽取医药信息 knowledge graph question and answer system entity extraction medical information

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1乔凯,陈可佳,陈景强.基于知识图谱与关键词注意机制的中文医疗问答匹配方法[J].模式识别与人工智能,2021,34(8):733-741. 被引量：9
2杨晔,裴雷,侯凤贞.基于中文医药文本的实体识别和图谱构建[J].中国药科大学学报,2023,54(3):363-371. 被引量：1
3袁凯琦,邓扬,陈道源,张冰,雷凯.医学知识图谱构建技术与研究进展[J].计算机应用研究,2018,35(7):1929-1936. 被引量：83
4曹明宇,李青青,杨志豪,王磊,张音,林鸿飞,王健.基于知识图谱的原发性肝癌知识问答系统[J].中文信息学报,2019,33(6):88-93. 被引量：46

二级参考文献21

1张朝胜,郭剑毅,线岩团,余正涛,雷春雅,王海雄.基于条件随机场的英文产品命名实体识别[J].计算机工程与科学,2010,32(6):115-117. 被引量：13
2侯丽,钱庆,黄利辉,李军莲,夏光辉.基于本体的临床医学知识库系统构建探讨[J].医学信息学杂志,2011,32(4):42-47. 被引量：19
3王昊奋,张金康,程小军.中文开放链接医疗数据的构建[J].中国数字医学,2013,8(4):5-8. 被引量：8
4李敬华,易小烈,杨德利,高宏杰,程英,于琦,于彤,朱玲,董燕,亢力.面向临床决策支持的中医脾胃病本体知识库构建研究[J].中国医学创新,2014,11(27):121-125. 被引量：10
5徐绪堪,房道伟,蒋勋,苏新宁.知识组织中知识粒度化表示和规范化研究[J].图书情报知识,2014,31(6):101-106. 被引量：35
6贾李蓉,于彤,崔蒙,杨硕,刘静,朱玲,董燕,高博,刘丽红.中医药学语言系统研究进展[J].中国数字医学,2014,9(10):57-59. 被引量：20
7郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：84
8贾李蓉,刘静,于彤,董燕,朱玲,高博,刘丽红.中医药知识图谱构建[J].医学信息学杂志,2015,36(8):51-53. 被引量：58
9庄严,李国良,冯建华.知识库实体对齐技术综述[J].计算机研究与发展,2016,53(1):165-192. 被引量：85
10刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：259

共引文献131

1仲怿,茹晨雷,张伯礼,程翼宇.基于知识图谱的中药制药过程质量控制方法学研究[J].中国中药杂志,2019,44(24):5269-5276. 被引量：22
2赵悦淑,王军,王蕊,昝红英,张坤丽,穗志方.中文医学知识图谱研究进展[J].中国数字医学,2021,16(6):86-91. 被引量：5
3赵梦雪,冯正直.近二十五年中国军人心理健康研究的知识图谱——基于CiteSpace的可视化分析[J].心理月刊,2022(16):1-7. 被引量：6
4洪海蓝,李文林,杨涛,李玥,梅文静.基于知识图谱的海洋中药智能问答系统的设计与实现[J].世界科学技术-中医药现代化,2023(6):1935-1941. 被引量：4
5昝红英,韩杨超,范亚鑫,牛承志,张坤丽,穗志方.中文症状知识库的建立与分析[J].中文信息学报,2020,34(4):30-37. 被引量：9
6王大阜,王静,邓志文,贾志勇,张浴日.深度学习赋能网络安全知识图谱实体关系联合抽取研究[J].中国电子科学研究院学报,2023,18(5):420-428. 被引量：1
7詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛.基于综合影响力模型的改进EvolveKG方法及应用研究[J].计算机应用研究,2020,37(S01):159-162.
8白亭颖,杨任飞,惠大涛,何文文,张琰光,贺晶.数字海洋研究的知识图谱分析与前景展望[J].测绘通报,2020(2):131-136. 被引量：8
9郭蕾,余波,张妍妍,温亮明.精准扶贫中的信息需求及其服务策略[J].图书馆论坛,2018,38(4):39-48. 被引量：13
10孔鸣,何前锋,李兰娟.人工智能辅助诊疗发展现状与战略研究[J].中国工程科学,2018,20(2):86-91. 被引量：68

1《中药材》杂志投稿须知[J].中药材,2023,46(8):2109-2110.
2陈展,杨佳.浅析高中生英语一词多义习得现状及培养途径[J].英语教师,2024,24(5):43-46.
3王素琴,王钰珏,石敏,朱登明,李兆歆.基于偏正结构表示的加工命名实体识别方法[J].计算机集成制造系统,2024,30(3):958-967.
4对医学名词规范使用的注意事项[J].中国社区医师,2024,40(5):64-64.
5对医学名词规范使用的注意事项[J].中外医药研究,2024,3(4):11-11.
6对医学名词规范使用的注意事项[J].中国社区医师,2024,40(6):145-145.
7刘科铭.论电子诊断技术在新能源汽车维修中的应用[J].中文科技期刊数据库（文摘版）工程技术,2024(3):0079-0082.
8王谭,陈金广,马丽丽.融合词典信息和句子语义的中文命名实体识别[J].计算机与现代化,2024(3):24-28.
9魏灿灿.知识产权惩罚性赔偿的审慎适用[J].中阿科技论坛（中英文）,2024(4):158-162.

南京工程学院学报（自然科学版）

2023年第4期

浏览历史

内容加载中请稍等...

基于自注意机制的中文医药命名实体识别算法研究

参考文献4

二级参考文献21

共引文献131

相关作者

相关机构

相关主题

浏览历史