-
题名基于主题提示的电力命名实体识别
- 1
-
-
作者
康雨萌
何玮
翟千惠
程雅梦
俞阳
-
机构
国网江苏营销服务中心
-
出处
《计算机系统应用》
2022年第9期272-279,共8页
-
基金
国网江苏省电力有限公司科技项目(J2021151)。
-
文摘
传统的命名实体识别方法可以凭借充足的监督数据实现较好的识别效果.而在针对电力文本的命名实体识别中,由于对专业知识的依赖,往往很难获取足够的监督数据,即存在少样本场景.同时,由于电力行业的精确性要求,相比于一般的开放领域任务,电力领域的实体类型更多,因此难度更大.针对这些挑战,本文提出了一个基于主题提示的命名实体识别方法.该方法将每个实体类型视为一个主题,并使用主题模型从训练语料中获取与类型相关的主题词.通过枚举实体跨度、实体类型、主题词以填充模板并构建提示句.使用生成式预训练语言模型对提示句排序,最终识别出实体与对应类型标签.实验结果表明,在中文电力命名实体识别数据集上,相比于几种传统命名实体方法,基于主题提示的方法取得了更好的效果.
-
关键词
命名实体识别
预训练模型
提示模板
主题模型
电力语料
-
Keywords
named entity recognition
pre-trained model
prompt template
topic model
electric power corpus
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TM73
[电气工程—电力系统及自动化]
-