反馈式K近邻语义迁移学习的领域命名实体识别被引量：7

Domain-named entity recognition based on feedback K-nearest semantic transfer learning

下载PDF

导出

摘要领域命名实体识别是构建领域知识图谱的重要基础。针对专业领域语料匮乏的特点,构建基于深度学习的BiLSTM-CNN-CRFs网络模型,并提出一种反馈式K近邻语义迁移学习的领域命名实体识别方法。首先,对专业领域语料和通用领域语料分别训练得到语料文档向量,使用马哈拉诺比斯距离计算领域语料与通用语料的语义相似性,针对每个专业领域样本分别取K个语义最相似的通用领域样本进行语义迁移学习,构建多个迁移语料集。然后,使用BiLSTM-CNN-CRFs网络模型对迁移语料集进行领域命名实体识别,并对识别结果进行评估和前馈,根据反馈结果选取合适的K值,作为语义迁移学习的最佳阈值。以包装领域和医疗领域为例进行实验验证,结果表明:本文方法取得了很好的识别效果,可以有效解决专业领域语料匮乏问题。 Domain-named entity recognition is an important foundation in constructing domain knowledge maps.In view of the scarcity of such recognition,this paper constructs a BiLSTM-CNN-CRFs network model based on deep learning as well as proposes a domain-named entity recognition method based on feedback K-nearest-neighbor semantic transfer learning.First,the corpus of the professional field and the general field were trained to obtain the corpus document vector,and the semantic similarity between the corpus of a domain and the common corpus was calculated using the Mahalanobis distance calculation.For each specialized domain sample,K common domain samples with the most similar semantics were taken for semantic transfer learning,and several transfer corpus sets were constructed.Then,the BiLSTM-CNN-CRFs network model was used to identify domain-named entities in N migration corpuses and evaluate and feedforward the recognition results.An appropriate K value was selected as the best threshold for semantic transfer learning according to the feedback results.The packaging and medical fields were taken as examples for experimental verification.The results showed that the method proposed in this paper has a good recognition effect and can effectively solve the problem of lack of corpus in the field of specialization.

作者朱艳辉李飞冀相冰曾志高徐啸 ZHU Yanhui;LI Fei;JI Xiangbing;ZENG Zhigao;XU Xiao(School of Computer,Hu’nan University of Technology,Zhuzhou 412008,China;Hu’nan Key Laboratory of Intelligent Information Perception and Processing Technology,Zhuzhou 412008,China)

机构地区湖南工业大学计算机学院湖南省智能信息感知及处理技术重点实验室

出处《智能系统学报》 CSCD 北大核心 2019年第4期820-830,共11页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(61402165) 湖南省教育厅重点项目(15A049) 湖南工业大学重点项目(17ZBLWT001KT006) 湖南省研究生科研创新项目(CX2017B688)

关键词领域命名实体识别反馈式K近邻语义迁移学习深度学习卷积神经网络文档向量马哈拉诺比斯距离包装领域医疗领域 domain-named entity recognition feedback K-nearest neighbor semantic transfer learning deep learning CNN Doc2Vec Mahalanobis distance packaging field medical field

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张海楠,伍大勇,刘悦,程学旗.基于深度神经网络的中文命名实体识别[J].中文信息学报,2017,31(4):28-35. 被引量：76
2姚霖,刘轶,李鑫鑫,刘宏.词边界字向量的中文命名实体识别[J].智能系统学报,2016,11(1):37-42. 被引量：8
3卞则康,王士同.基于相似度学习的多源迁移算法[J].控制与决策,2017,32(11):1941-1948. 被引量：10
4庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：471
5杨绪兵,王一雄,陈斌.马氏度量学习中的几个关键问题研究及几何解释[J].南京大学学报（自然科学版）,2013,49(2):133-141. 被引量：17

二级参考文献108

1杨绪兵,陈松灿,杨益民.局部化的广义特征值最接近支持向量机[J].计算机学报,2007,30(8):1227-1234. 被引量：10
2Xing E P,Ng A Y,Jordan M I. Distance metric learning with application to clustering with side-information[J].Advances in Neural Information Process ing Systems,2002.521-528.
3Weinberger K Q,Saul L K. Distance metric learning for large margin nearest neighbor classification[J].Journal of Machine Learning Research,2009.207-244.
4Cover T,Hart P. Nearest neighbor pattern classification[J].IEEE Transactions on Information theory,1967.21-27.
5Chopra S,Hadsell R,LeCun Y. Learning a similiarty metric discriminatively,with application to face verification[A].San Diego,California,USA,2005.539-546.
6Domeniconi C,Gunopulos D,Peng J. Large margin nearest neighbor classifiers[J].IEEE Transactions on Neural Networks,2005,(04):899-909.doi:10.1109/TNN.2005.849821.
7Goldberger J,Roweis S,Hinton G. Neighbourhood components analysis[A].Cambridge:MIT Press,MA,2005.513-520.
8Huang K,Yang H,King I. Learning large margin classifiers locally and globally[A].Banff,Canada,2004.260-272.
9Yeung D S,Wang D,Ng W W Y. Structured large margin machines=Sensitive to data distribu tions[J].Machine Learning,2007.171-200.
10Lanckriet G R G,Ghaoui L E,Bhattacharyya C. A robust minimax approach to classification[J].Journal of Machine Learning Research,2002.555-582.

共引文献573

1康文杰,田苗,林岚,孙珅,吴水才.深度卷积生成对抗网络对神经影像通用数据特征的学习[J].智慧健康,2020(31):1-4. 被引量：2
2张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：24
3陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
4吴锐帆,代海洋,杨坦,江颖,蔡志杰.直肠癌淋巴结转移的智能诊断研究[J].数学建模及其应用,2019,8(4):30-37. 被引量：2
5步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
6刘世晶,刘阳春,钱程,郑浩君,周捷,张成林.基于CycleGAN和注意力增强迁移学习的小样本鱼类识别[J].农业机械学报,2023,54(S01):296-302. 被引量：5
7张璐,黄琳,李备备,陈鑫,段青玲.基于多尺度融合与无锚点YOLO v3的鱼群计数方法[J].农业机械学报,2021,52(S01):237-244. 被引量：16
8成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
9张红洋,田瑞盟.基于SOLO分类理论的科学思维学业质量评价[J].湖南中学物理,2021(2):1-4. 被引量：1
10林峰,郭鹏,刘旭斌.基于叶片表面污垢预处理与CNN的风电机组叶片表面损伤识别[J].动力工程学报,2020(12):975-981. 被引量：6

同被引文献48

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2肖瑞,胡冯菊,裴卫.基于BiLSTM-CRF的中医文本命名实体识别[J].世界科学技术-中医药现代化,2020,22(7):2504-2510. 被引量：33
3杨锡运,张艳峰,叶天泽,苏杰.基于朴素贝叶斯的风电功率组合概率区间预测[J].高电压技术,2020,46(3):1099-1108. 被引量：58
4何林娜,杨志豪,林鸿飞,李彦鹏,唐利娟.基于特征耦合泛化的药名实体识别[J].中文信息学报,2014,28(2):72-77. 被引量：11
5张倩,李明,王雪松,程玉虎,朱美强.一种面向多源领域的实例迁移学习[J].自动化学报,2014,40(6):1176-1183. 被引量：24
6张博,史忠植,赵晓非,张建华.一种基于跨领域典型相关性分析的迁移学习方法[J].计算机学报,2015,38(7):1326-1336. 被引量：29
7刘少鹏,印鉴,欧阳佳,黄云,杨晓颖.基于MB-HDP模型的微博主题挖掘[J].计算机学报,2015,38(7):1408-1419. 被引量：31
8杨兴明,吴克伟,孙永宣,谢昭.可迁移测度准则下的协变量偏移修正多源集成方法[J].电子与信息学报,2015,37(12):2913-2920. 被引量：2
9刘振,杨俊安,刘辉,王伟.模糊近邻密度聚类与重采样的迁移学习算法[J].信号处理,2016,32(6):651-659. 被引量：3
10李天辰,殷建平.基于主题聚类的情感极性判别方法[J].计算机科学与探索,2016,10(7):989-994. 被引量：7

引证文献7

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2万家山.基于深度学习的混合主题模型应用[J].湖南科技大学学报（自然科学版）,2020,35(3):102-109.
3毛明毅,吴晨,钟义信,陈志成.加入自注意力机制的BERT命名实体识别模型[J].智能系统学报,2020,15(4):772-779. 被引量：26
4程凯,彭小圣,徐其友,王勃,刘纯,车建峰.基于特征选择与多层级深度迁移学习的风电场短期功率预测[J].高电压技术,2022,48(2):497-503. 被引量：17
5尚福华,马宁,解红涛.基于主动学习的试油气井控领域命名实体识别模型[J].计算技术与自动化,2022,41(2):178-183.
6马海瑛.基于迁移学习的网络身份双向认证技术[J].微型电脑应用,2022,38(9):163-165. 被引量：1
7余肖生,张合欢,陈鹏.基于混合式迁移学习的命名实体识别算法[J].计算机应用与软件,2024,41(8):303-310.

二级引证文献59

1赵梓博,王昊,刘友华,张卫,孟镇.多任务环境下融合迁移学习的新冠疫情新闻要素识别研究[J].知识管理论坛,2021(1):2-13. 被引量：1
2余传明,黄婷婷,林虹君,安璐.基于标签迁移和深度学习的跨语言实体抽取研究[J].现代情报,2020,40(12):3-16. 被引量：5
3邱立伟,关伟丽,张伟进.BERT语言模型的探究[J].电脑编程技巧与维护,2021(1):21-23. 被引量：1
4曾瑜,杨晓妍,张伟.长短期记忆网络在医药卫生和生物医学领域的应用现状[J].华西医学,2021,36(1):131-136.
5廉龙颖,孔萨,郭京伟.融合BERT的网络空间安全实体识别方法[J].黑龙江科技大学学报,2021,31(3):394-398. 被引量：1
6韩普,张展鹏,张明淘,顾亮.基于多特征融合的中文疾病名称归一化研究[J].数据分析与知识发现,2021,5(5):83-94. 被引量：4
7张岑芳.基于主动学习的命名实体识别算法[J].计算机与现代化,2021(7):18-22. 被引量：2
8任媛,于红,杨鹤,刘巨升,杨惠宁,孙哲涛,张思佳,刘明剑,孙华.融合注意力机制与BERT+BiLSTM+CRF模型的渔业标准定量指标识别[J].农业工程学报,2021,37(10):135-141. 被引量：21
9韩普,张展鹏,张伟.基于多任务学习和多态语义特征的中文疾病名称归一化研究[J].情报学报,2021,40(11):1234-1244. 被引量：5
10胡康,何思宇,左敏,葛伟.基于CNN-BLSTM的化妆品违法违规行为分类模型[J].智能系统学报,2021,16(6):1151-1157. 被引量：1

1孙娟娟,于红,冯艳红,彭松,程名,卢晓黎,董婉婷,崔榛.基于深度学习的渔业领域命名实体识别[J].大连海洋大学学报,2018,33(2):265-269. 被引量：25
2杨辉,赵雪松,孙彦飞,王铁栋,宗军君,庆丰.利用近场多波长激光雷达对生物气溶胶的偏振测量[J].大气与环境光学学报,2018,13(1):52-58.
3张若彬,刘嘉勇,何祥.基于BLSTM-CRF模型的安全漏洞领域命名实体识别[J].四川大学学报（自然科学版）,2019,56(3):469-475. 被引量：16
4夏邢,薛涛,李婷.基于Spark的模糊C均值算法改进[J].西安工程大学学报,2019,33(1):100-105. 被引量：5
5王景.人工智能在电子政务外网安全防护中的应用[J].科学与信息化,2018,0(8):37-37.
6贾泓昊,罗智勇.基于序列标注的引语识别初探[J].中文信息学报,2019,33(2):1-7. 被引量：2
7李芊芊,张克亮.基于依存分析的军事领域英文实体关系抽取研究[J].情报工程,2019,5(1):98-112. 被引量：3
8阴爱英,吴运兵,郑一江,余小燕.基于fastText模型的词向量表示改进算法[J].福州大学学报（自然科学版）,2019,47(3):314-319. 被引量：10
9李健龙,王盼卿,韩琪羽.基于双向LSTM的军事命名实体识别[J].计算机工程与科学,2019,41(4):713-718. 被引量：20
10李自青,闫玉清,张年萍,白春阳,房清丽.Toll样受体信号通路与冠心病关系的生物信息学分析[J].中国全科医学,2019,22(17):2069-2074. 被引量：13

智能系统学报

2019年第4期

浏览历史

内容加载中请稍等...

反馈式K近邻语义迁移学习的领域命名实体识别被引量：7

参考文献5

二级参考文献108

共引文献573

同被引文献48

引证文献7

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

反馈式K近邻语义迁移学习的领域命名实体识别 被引量：7

参考文献5

二级参考文献108

共引文献573

同被引文献48

引证文献7

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

反馈式K近邻语义迁移学习的领域命名实体识别被引量：7