期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于RoBERTa的电力领域词汇挖掘模型
被引量:
1
1
作者
黄源航
强梦烨
+3 位作者
李涛
晏明昊
张涵艺
贾大昌
《电力大数据》
2022年第6期1-8,共8页
针对中文电力领域词汇挖掘专业难度大、人工成本高的问题,本文利用深度学习技术,设计了一种结合大规模预训练语言模型、双向长短期记忆网络和条件随机场的电力领域词汇挖掘模型。该模型是一种不涉及任何特征工程的完全端到端的神经网络...
针对中文电力领域词汇挖掘专业难度大、人工成本高的问题,本文利用深度学习技术,设计了一种结合大规模预训练语言模型、双向长短期记忆网络和条件随机场的电力领域词汇挖掘模型。该模型是一种不涉及任何特征工程的完全端到端的神经网络模型,其将RoBERTa模型继续在电力文本语料上预训练以进行领域自适应,同时利用长短期记忆网络整合文本上下文语义信息,并通过条件随机场对预测的标签序列进行约束进而优化实体识别效果。由于现有的电力领域词汇挖掘研究缺乏高质量的标注数据集资源,该文构建了一个具有一定规模的中文电力领域词汇挖掘标注数据集。该文在标注数据集上进行了一系列实验,实验结果验证了模型的有效性。
展开更多
关键词
电力
词汇挖掘
自然语言处理
命名实体识别
深度学习
下载PDF
职称材料
题名
基于RoBERTa的电力领域词汇挖掘模型
被引量:
1
1
作者
黄源航
强梦烨
李涛
晏明昊
张涵艺
贾大昌
机构
国网江苏省电力有限公司无锡供电分公司
字节跳动科技有限公司
出处
《电力大数据》
2022年第6期1-8,共8页
文摘
针对中文电力领域词汇挖掘专业难度大、人工成本高的问题,本文利用深度学习技术,设计了一种结合大规模预训练语言模型、双向长短期记忆网络和条件随机场的电力领域词汇挖掘模型。该模型是一种不涉及任何特征工程的完全端到端的神经网络模型,其将RoBERTa模型继续在电力文本语料上预训练以进行领域自适应,同时利用长短期记忆网络整合文本上下文语义信息,并通过条件随机场对预测的标签序列进行约束进而优化实体识别效果。由于现有的电力领域词汇挖掘研究缺乏高质量的标注数据集资源,该文构建了一个具有一定规模的中文电力领域词汇挖掘标注数据集。该文在标注数据集上进行了一系列实验,实验结果验证了模型的有效性。
关键词
电力
词汇挖掘
自然语言处理
命名实体识别
深度学习
Keywords
power
terminologies mining
natural language processing
named entity recognition
deep learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于RoBERTa的电力领域词汇挖掘模型
黄源航
强梦烨
李涛
晏明昊
张涵艺
贾大昌
《电力大数据》
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部