-
题名基于增强优化预训练语言模型的电力数据实体识别方法
- 1
-
-
作者
田雪涵
董坤
赵剑锋
郭希瑞
-
机构
东南大学软件学院
东南大学电气工程学院
南京林业大学信息科学技术学院
-
出处
《智慧电力》
北大核心
2024年第6期100-107,共8页
-
基金
国家自然科学基金资助项目(52077039)。
-
文摘
知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原始数据集,采用增强优化预训练语言模型(RoBERTa)进行动态语义编码,利用双向长短期记忆网络(BiLSTM)和条件随机场(CRF)提取特征并优化标签。实验结果表明,该实体识别方法比传统基于深度学习的实体识别方法的平均数指标F1分数高2.17%,证实其对构建电力数据知识图谱的识别效果。
-
关键词
知识图谱
实体识别
数据增强
预训练语言模型
双向长短期记忆网络
条件随机场
-
Keywords
knowledge graph
entity recognition
data augmentation
pre-trained language model
bidirectional long short term memory network
conditional random field
-
分类号
TM769
[电气工程—电力系统及自动化]
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种强人工智能的实现方法
- 2
-
-
作者
李成前
孙志远
田雪涵
-
机构
辽宁省沈阳市沈阳理工大学理学院
-
出处
《通讯世界(下半月)》
2016年第8期241-241,共1页
-
文摘
在当今时代,人们已经步入了高速发展的社会,在生活的各个角落,人们不断的上传和下载数据,然而随着数据的数量呈几何倍增长,人类已经不能凭借脑力去处理这些信息了。若想处理这些信息,人类必将借助人工智能,去处理这些复杂的信息。
-
关键词
人工智能
系统
方法
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-