-
题名面向电力领域自然语言理解的数据增强研究与实现
- 1
-
-
作者
施俊威
宋晖
-
机构
东华大学计算机科学与技术学院
-
出处
《现代计算机》
2023年第16期21-26,共6页
-
文摘
探究面向领域智能问答中自然语言理解的数据增强问题。由于应用缺乏历史数据,且人工标注成本高,无法满足大规模训练自然语言理解模型的需求。因此,对传统数据增强的方法进行研究,提出使用基于对比搜索的关键字文本生成模型,以此生成了具有句式表达多样性的的数据集。实验结果表明,相比传统的集中搜索算法,使用对比搜索作为模型的解码策略能够生成更加准确和合理的电力领域问题文本,有效地降低了生成文本的词重复率。利用这些样本数据,成功地训练了一个高效准确的自然语言理解模型,提高了用户意图识别的准确率。这一研究对于智能问答领域的实际应用具有一定的参考价值。
-
关键词
自然语言理解
文本生成
对比搜索
数据增强
智能问答
-
Keywords
natural language understanding
text generation
contrastive search
data augmentation
intelligent question-answering
-
分类号
TM73
[电气工程—电力系统及自动化]
TP391.1
[自动化与计算机技术—计算机应用技术]
-