期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于RoBERTa的电力领域词汇挖掘模型 被引量:1
1
作者 黄源航 强梦烨 +3 位作者 李涛 晏明昊 张涵艺 贾大昌 《电力大数据》 2022年第6期1-8,共8页
针对中文电力领域词汇挖掘专业难度大、人工成本高的问题,本文利用深度学习技术,设计了一种结合大规模预训练语言模型、双向长短期记忆网络和条件随机场的电力领域词汇挖掘模型。该模型是一种不涉及任何特征工程的完全端到端的神经网络... 针对中文电力领域词汇挖掘专业难度大、人工成本高的问题,本文利用深度学习技术,设计了一种结合大规模预训练语言模型、双向长短期记忆网络和条件随机场的电力领域词汇挖掘模型。该模型是一种不涉及任何特征工程的完全端到端的神经网络模型,其将RoBERTa模型继续在电力文本语料上预训练以进行领域自适应,同时利用长短期记忆网络整合文本上下文语义信息,并通过条件随机场对预测的标签序列进行约束进而优化实体识别效果。由于现有的电力领域词汇挖掘研究缺乏高质量的标注数据集资源,该文构建了一个具有一定规模的中文电力领域词汇挖掘标注数据集。该文在标注数据集上进行了一系列实验,实验结果验证了模型的有效性。 展开更多
关键词 电力 词汇挖掘 自然语言处理 命名实体识别 深度学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部