-
题名基于知识迁移和蒸馏的轻量级领域信息表示模型研究
- 1
-
-
作者
徐欢
王尧
萧展辉
沈宇红
-
机构
南方电网有限责任公司
南方电网数字电网研究院有限责任公司
-
出处
《电力大数据》
2022年第9期37-44,共8页
-
文摘
数据精细化处理是电网企业在进行数字化转型过程中的重大难题。由于电网企业的封闭性特点,数据精细化处理过程中专业语言与知识难以与外界通用的知识进行融会贯通。为解决上述问题,本文在teacher-student框架基础上结合fine-tuning技术设计了一种有效的信息表示模型——基于知识迁移与蒸馏的轻量级领域信息表示模型。该模型将通用知识框架作为基座,将专业知识与通用知识提炼成一个统一的向量空间。本文设计的模型比通用大模型更快、更轻量、更有效,仅需对百级别的专业小样本进行增量学习,便可将通用知识与专业知识进行了高效地融合。为了验证该模型的有效性,我们在文本相似度计算任务上进行了实验,实验结果表明技术指标NDCG@5提升5.76%。此外,该模型有效地降低了资源消耗,提升了搜索效率。
-
关键词
知识迁移
模型蒸馏
领域信息检索模型
数字化转型
-
Keywords
knowledge transfer
model distillation
domain information retrieval model
digital transformation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-