面向知识获取的电力科技领域语言模型研究

Research on Language Model for Knowledge Acquisition in the Field of Electric Power Technology

下载PDF

导出

摘要为克服电力科技文本专业化、跨学科特点给知识获取带来的挑战,提出构建电力科技领域语言模型,实现更准确的文本表示。文章收集大量电力科技论文、专利、项目等文本,基于Transformer模型预训练得到领域语言模型,设计电力科技术语分类和电力科技远程监督实体关系抽取2类知识抽取任务进行模型验证,实验结果表明,所提领域语言模型在术语分类任务上的F1分数较word2vec基准模型提升超过10%,在实体关系抽取任务上的AUC分数比BERT语言模型基准模型提升约2%,所提模型有利于为下游知识获取任务提供更高质量特征表示。 To overcome the challenges of knowledge acquisition brought by the specialization and interdisciplinary characteristics of electric power science and technology texts,a power technology language model is proposed to achieve a more accurate text representation.The Transformer-based language model is pre-trained on large-scale power technology papers,patents,projects,and other texts.Two tasks including power science and technology term classification and distantly supervised entity relation extraction are proposed for verifying the model.Experiment results show that the F1-score of the proposed domain language model on the term classification task is more than 10%higher than that of the word2vec benchmark model,and the AUC score on the entity relation extraction task is about 2%higher than the BERT benchmark model.The proposed language model is beneficial to provide higher-quality feature representations for downstream knowledge acquisition tasks.

作者徐翀王其清 XU Chong;WANG Qiqing(State Grid Energy Research Institute Co.,Ltd.,Changping District,Beijing 102209,China)

机构地区国网能源研究院有限公司

出处《电力信息与通信技术》 2023年第4期31-36,共6页 Electric Power Information and Communication Technology

基金国家电网有限公司总部科技项目资助“基于知识图谱的科技咨询专家智能优选技术研究与开发”(1400-202057269A-0-0-00)。

关键词电力科技知识获取语言模型自然语言处理 electric power technology knowledge acquisition language model natural language processing

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1吴克河,王继业,李为,朱亚运.面向能源互联网的新一代电力系统运行模式研究[J].中国电机工程学报,2019,39(4):966-979. 被引量：105
2蒋晨,王渊,胡俊华,徐积全,陈珉,王雅雯,马国明.基于深度学习的电力实体信息识别方法[J].电网技术,2021,45(6):2141-2149. 被引量：29
3王宏刚,纪鑫,武同心,杨智伟,何禹德.基于预训练语言模型的电力领域设备缺陷检测[J].电测与仪表,2022,59(5):180-186. 被引量：4
4刘赫,皮俊波,宋鹏程,赵翰林,张越,刘显壮.基于混合神经网络的电力调度文本事件抽取方法[J].中国电力,2022,55(9):105-110. 被引量：10
5叶欣智,尚磊,董旭柱,刘承锡,田野,方华亮.面向配电网故障处置的知识图谱研究与应用[J].电网技术,2022,46(10):3739-3748. 被引量：20
6谭刚,陈聿,彭云竹.融合领域特征知识图谱的电网客服问答系统[J].计算机工程与应用,2020,56(3):232-239. 被引量：24
7郭榕,杨群,刘绍翰,李伟,袁鑫,黄香鸿.电网故障处置知识图谱构建研究与应用[J].电网技术,2021,45(6):2092-2100. 被引量：62
8刘梓权,王慧芳.基于知识图谱技术的电力设备缺陷记录检索方法[J].电力系统自动化,2018,42(14):158-164. 被引量：95
9贺兴,艾芊,朱天怡,邱才明,张东霞.数字孪生在电力系统应用中的机遇和挑战[J].电网技术,2020,44(6):2009-2019. 被引量：124

二级参考文献102

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：50
2陶洪铸,翟明玉,许洪强,季学纯,刘金波,徐丽燕.适应调控领域应用场景的人工智能平台体系架构及关键技术[J].电网技术,2020,44(2):412-419. 被引量：36
3范士雄,李立新,王松岩,刘幸蔚,於益军,郝博文.人工智能技术在电网调控中的应用研究[J].电网技术,2020,44(2):401-411. 被引量：106
4李明节,陶洪铸,许洪强,刘金波,张强,张伟.电网调控领域人工智能技术框架与应用展望[J].电网技术,2020,44(2):393-400. 被引量：77
5蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：209
6云晓春,余翔湛.基于确认度失效检测算法的研究与设计[J].北京邮电大学学报,2005,28(3):10-13. 被引量：7
7章健,艾芊,王新刚.多代理系统在微电网中的应用[J].电力系统自动化,2008,32(24):80-82. 被引量：104
8牛卢璐,贾宏杰.一种适用于非侵入式负荷监测的暂态事件检测算法[J].电力系统自动化,2011,35(9):30-35. 被引量：102
9赵俊华,文福拴,薛禹胜,董朝阳.电力信息物理融合系统的建模分析与控制研究框架[J].电力系统自动化,2011,35(16):1-8. 被引量：155
10李静,罗文华,林鸿飞.自然语言处理技术在网络案情分析系统中的应用[J].计算机工程与应用,2012,48(3):216-220. 被引量：5

共引文献424

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：50
2袁野,刘佳伟,赵惠浞,左志平,葛超,朱晋锐.基于知识图谱的钢厂设备故障智能诊断技术研究与应用[J].冶金设备,2023(S02):20-25.
3谢宇,郑弘欣.数字孪生技术在心理危机预警与干预中的研究进展[J].心理月刊,2024(3):218-220.
4张敏杰,徐宁,胡俊华,王宇飞,李晨,徐剑波,张诗玉.面向变压器智能运检的知识图谱构建和智能问答技术研究[J].全球能源互联网,2020,3(6):607-617. 被引量：13
5胡国伟,高正平,谈健,吴晨,陈琛,牛文娟.能源互联网背景下用户用能价值挖掘及成效分析[J].全球能源互联网,2019,0(6):566-571. 被引量：1
6李小宝,李欣,李圣清,刘博文.孤岛模式下并联VSG的无功均分控制策略[J].电力电子技术,2023,57(9):83-86. 被引量：1
7Bowen Hong,Qionghui Li,Wanqing Chen,Bibin Huang,Hu Yan,Kaihui Feng.Supply modes for renewable-based distributed energy systems and their applications:case studies in China[J].Global Energy Interconnection,2020,3(3):259-271. 被引量：5
8蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：209
9李鹏飞,张延迟,张倩,宋悦琳.多能形式能源路由器的能量流动研究[J].分布式能源,2020,0(1):35-43. 被引量：2
10欧卫安.刑事辩护制度的文化视野[J].中国刑事法杂志,2000(1):67-84. 被引量：20

1田梦.申能电力科技总经理冯伟忠双碳目标指引发展方向技术创新开拓煤电未来[J].中国高新科技,2023(1):33-34.
2邱云飞,邢浩然,李刚.矿井建设知识图谱构建研究综述[J].计算机工程与应用,2023,59(7):64-79. 被引量：3
3汤洁仪,李大军,刘波.基于BERT-BiLSTM-CRF模型的地理实体命名实体识别[J].北京测绘,2023,37(2):143-147. 被引量：7
4张媛媛.乡村振兴背景下中国农村中小学教师普通话能力实证研究——基于河南省的调查[J].复印报刊资料（语言文字学）,2022(9):120-127.
5《电力科学与技术学报》征稿启事[J].电力科学与技术学报,2023,38(1).
6袁泉,徐雲鹏,唐成亮.基于路径标签的文档级关系抽取方法[J].计算机应用,2023,43(4):1029-1035.
7郭思慧,王新.科技翻译中的术语管理探究[J].中文科技期刊数据库（全文版）社会科学,2022(2):152-155.
8张倩.科技俄语翻译探究[J].延边教育学院学报,2022,36(6):75-77.
9赵越,马文卿.国内心理语言学研究综述——基于CiteSpace的可视化图谱[J].文化学刊,2023(1):156-159.
10彭博,童兆莉.网络文化遗产信息资源知识图谱的构建及其应用研究[J].情报科学,2023,41(3):100-108. 被引量：3

电力信息与通信技术

2023年第4期

浏览历史

内容加载中请稍等...

面向知识获取的电力科技领域语言模型研究

参考文献9

二级参考文献102

共引文献424

相关作者

相关机构

相关主题

浏览历史