基于参数迁移的领域命名实体识别方法被引量：2

Domain Named Entity Recognition Method Based on Parameter Transfer Learning

下载PDF

导出

摘要 [目的/意义]命名实体识别是自然语言处理领域中的基础任务,基于深度学习的方法在通用领域的命名实体中取得了显著成果,但在特定领域识别效果不佳。为了解决工业信息化领域标注数据不足,数据特征差异较大、模型难以扩展的问题,首先提出了一种基于Transformer的有限区间命名实体识别模型。[方法/过程]采用预训练模型对文本进行分布式表示,然后利用基于有限区间的标注方法对输入序列进行标注,解决传统标注法在训练过程中可能导致的序列标注不一致的问题。在此基础上,引入迁移学习策略,采用参数共享的方式,将通用领域的命名实体识别模型迁移到工业信息化领域,并在工业信息化领域数据集上进行微调,最终获得在工业信息化领域上表现良好的模型。[结果/结论]实验结果表明,本文提出的有限区间命名实体识别模型在工业信息化领域数据集上的准确率较基线模型提高了8.7%,基于参数迁移的领域命名实体识别方法在人民日报语料和工业信息化领域数据集上的准确率和综合指标F值相较未使用迁移学习的模型分别提高了3.1%和1.1%,证明了迁移策略的有效性。 [Objective/Significance]Named entity recognition is a fundamental task in natural language processing,and deep learning-based methods have achieved remarkable results in general domains,but not in specific domains.Aiming at the problems of insufficient labeling samples,quite differences in data features and difficulty in model expansion,this paper introduces a limited span-based transformer classifier for named entity recognition model(Span-based Transformer Classifier for Named Entity Recognition,STCNER).[Methods/Process]The model takes advantage of the features extraction of Encoder in Transformer and combines with the limited span-based labeling method,which solves the problem of the sequence labeling inconsistency caused by traditional labeling method in the training process.On this basis,then introduce the transfer learning strategy which adopt the parameter sharing method to transfer the named entity recognition model in general domains to the specific domains.After fine-tuning it on the domain-specific dataset,the model performs well in specific domain.[Results/Conclusions]The experimental results show that the accuracy of STCNER model is 8.7%higher than the baseline model on the dataset in the industrial informatization field.Compared with the model without transfer learning,the accuracy and F-scores are improved by 3.1%and 1.1%respectively on the corpus of People's Daily and the data set in the industrial informatization field,which proves the effectiveness of the transfer strategy.

作者孙新任翔渝郑洪超杨凯歌 SUN Xin;REN XiangYu;ZHENG Hongchao;YANG Kaige(School of Computer Science and Technology,Beijing Institute of Technology,Beijing 100081,China;The Key Laboratory of Rich-Media Knowledge Organization and Service of Digital Publishing Content,Beijing 100036,China)

机构地区北京理工大学计算机学院富媒体数字出版内容组织与知识服务重点实验室

出处《情报工程》 2022年第3期13-27,共15页 Technology Intelligence Engineering

基金富媒体数字出版内容组织与知识服务重点实验室开放基金项目“基于模糊粗糙集理论的远程监督关系抽取研究”(ZD2021-11/06)。

关键词命名实体识别深度学习迁移学习预训练语言模型 Named entity recognition deep learning transfer learning pre-trained language model

分类号 G35 [文化科学—情报学] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1高甦,金佩,张德政.基于深度学习的中医典籍命名实体识别研究[J].情报工程,2019,5(1):113-123. 被引量：29
2冯建周,马祥聪.基于迁移学习的细粒度实体分类方法的研究[J].自动化学报,2020,46(8):1759-1766. 被引量：11
3武惠,吕立,于碧辉.基于迁移学习和BiLSTM-CRF的中文命名实体识别[J].小型微型计算机系统,2019,40(6):1142-1147. 被引量：53
4庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：471
5石教祥,朱礼军,望俊成,王政,魏超.面向少量标注数据的命名实体识别研究[J].情报工程,2020,6(4):37-50. 被引量：8
6丁龙,文雯,林强.基于预训练BERT字嵌入模型的领域实体识别[J].情报工程,2019,5(6):65-74. 被引量：9
7琚生根,李天宁,孙界平.基于关联记忆网络的中文细粒度命名实体识别[J].软件学报,2021,32(8):2545-2556. 被引量：12

二级参考文献112

1李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
2向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
3姜维,王晓龙,关毅,赵健.基于多知识源的中文词法分析系统[J].计算机学报,2007,30(1):137-145. 被引量：29
4Ben-David S,Blitzer J,Crammer K,Pereira F.Analysis of representations for domain adaptation.In:Platt JC,Koller D,Singer Y,Roweis ST,eds.Proc.of the Advances in Neural Information Processing Systems 19.Cambridge:MIT Press,2007.137-144.
5Blitzer J,McDonald R,Pereira F.Domain adaptation with structural correspondence learning.In:Jurafsky D,Gaussier E,eds.Proc.of the Int’l Conf.on Empirical Methods in Natural Language Processing.Stroudsburg PA:ACL,2006.120-128.
6Dai WY,Xue GR,Yang Q,Yu Y.Co-Clustering based classification for out-of-domain documents.In:Proc.of the 13th ACM Int’l Conf.on Knowledge Discovery and Data Mining.New York:ACM Press,2007.210-219.[doi:10.1145/1281192.1281218].
7Dai WY,Xue GR,Yang Q,Yu Y.Transferring naive Bayes classifiers for text classification.In:Proc.of the 22nd Conf.on Artificial Intelligence.AAAI Press,2007.540-545.
8Liao XJ,Xue Y,Carin L.Logistic regression with an auxiliary data source.In:Proc.of the 22nd lnt*I Conf.on Machine Learning.San Francisco:Morgan Kaufmann Publishers,2005.505-512.[doi:10.1145/1102351.1102415].
9Xing DK,Dai WY,Xue GR,Yu Y.Bridged refinement for transfer learning.In:Proc.of the Ilth European Conf.on Practice of Knowledge Discovery in Databases.Berlin:Springer-Verlag,2007.324-335.[doi:10.1007/978-3-540-74976-9_31].
10Mahmud MMH.On universal transfer learning.In:Proc.of the 18th Int’l Conf.on Algorithmic Learning Theory.Sendai,2007.135-149.[doi:10,1007/978-3-540-75225-7_14].

共引文献583

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2康文杰,田苗,林岚,孙珅,吴水才.深度卷积生成对抗网络对神经影像通用数据特征的学习[J].智慧健康,2020(31):1-4. 被引量：2
3张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：24
4孔静静,于琦,李敬华,于彤,张竹绿,田野,祖雅琪.实体抽取综述及其在中医药领域的应用[J].世界科学技术-中医药现代化,2022,24(8):2957-2963. 被引量：6
5陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
6吴锐帆,代海洋,杨坦,江颖,蔡志杰.直肠癌淋巴结转移的智能诊断研究[J].数学建模及其应用,2019,8(4):30-37. 被引量：2
7刘世晶,刘阳春,钱程,郑浩君,周捷,张成林.基于CycleGAN和注意力增强迁移学习的小样本鱼类识别[J].农业机械学报,2023,54(S01):296-302. 被引量：5
8张璐,黄琳,李备备,陈鑫,段青玲.基于多尺度融合与无锚点YOLO v3的鱼群计数方法[J].农业机械学报,2021,52(S01):237-244. 被引量：16
9余克健,张程,乐毅,吴云志.基于GPT修正农业病虫害命名实体识别方法[J].内蒙古农业大学学报（自然科学版）,2023,44(5):34-43. 被引量：2
10姚元杰,龚毅光,刘佳,陈嫚丽.基于多粒度信息融合的气象知识命名实体识别[J].计算机与数字工程,2023,51(1):186-193.

同被引文献18

1唐爱民,真溱,樊静.基于叙词表的领域本体构建研究[J].现代图书情报技术,2005(4):1-5. 被引量：43
2丁晟春,傅柱.基于航天叙词表的领域本体半自动化构建研究[J].情报理论与实践,2011,34(11):113-116. 被引量：18
3冯蕴天,张宏军,郝文宁.面向军事文本的命名实体识别[J].计算机科学,2015,42(7):15-18. 被引量：50
4朱颢东,杨立志,丁温雪,冯嘉美.基于主题标签和CRF的中文微博命名实体识别[J].华中师范大学学报（自然科学版）,2018,52(3):316-321. 被引量：13
5贺琳,张雨,巴韩飞.基于注意力机制和深度学习模型的外来海洋生物命名实体识别[J].大连海洋大学学报,2021,36(3):503-509. 被引量：6
6唐锐,邓建新,叶志兴,张海平.PDF文件的表格抽取研究综述[J].计算机应用与软件,2021,38(7):1-7. 被引量：8
7申云凤.多源异构数据情境下公安知识图谱模型构建与智能应用[J].警学研究,2021(5):79-89. 被引量：2
8王雅琳,邹江枫,王凯,袁小锋,谢胜利.基于本体引导的注塑知识图谱构建及缺陷溯因应用[J].电子与信息学报,2022,44(5):1521-1529. 被引量：5
9冀振燕,孔德焱,刘伟,董为,桑艳娟.基于深度学习的命名实体识别研究[J].计算机集成制造系统,2022,28(6):1603-1615. 被引量：11
10崔磊,徐毅恒,吕腾超,韦福如.文档智能:数据集、模型和应用[J].中文信息学报,2022,36(6):1-19. 被引量：8

引证文献2

1王彤,王春山,李久熙,朱华吉,缪祎晟,吴华瑞.基于RoFormer预训练模型的指针网络农业病害命名实体识别[J].智慧农业（中英文）,2024,6(2):85-94.
2赖欣,李思宁,梁昌盛,张恒嫣.基于本体驱动的航空情报表格信息结构化研究[J].计算机科学,2024,51(S01):693-699.

1彭秋茹,王东波,黄水清.面向新时代的人民日报语料中文分词歧义分析[J].情报科学,2021,39(11):103-109. 被引量：3
2参考文献著录格式[J].中国煤炭地质,2022,34(8).
3周二专,张思远,严剑峰,吴倩红.电网调控决策知识模型建模及实现方法[J].中国电机工程学报,2022,42(14):5057-5066. 被引量：8
4范楷斌.会计信息化进程中企业内部控制的优化措施[J].乡镇企业导报,2022(8):154-156.
5薛诗艺.音韵学知识在古典诗词教学中的应用[J].开封文化艺术职业学院学报,2022,42(5):35-37.
6石道元,朱天好,伍鸿旭.我国会计信息化研究:合作、热点及演进——基于科学知识图谱的研究[J].会计之友,2022(17):23-29. 被引量：5
7张立杰,于金须,闫建华,杜义浩,谢平,李永泉.基于人机共融的外骨骼机构构型综合及优选方法[J].机械工程学报,2022,58(11):37-45. 被引量：3

情报工程

2022年第3期

浏览历史

内容加载中请稍等...

基于参数迁移的领域命名实体识别方法被引量：2

参考文献7

二级参考文献112

共引文献583

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于参数迁移的领域命名实体识别方法 被引量：2

参考文献7

二级参考文献112

共引文献583

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于参数迁移的领域命名实体识别方法被引量：2