-
题名面向变电站智能运检的声音谱特征语音识别方法
被引量:1
- 1
-
-
作者
高宝明
孙国繁
冯俊杰
段雨松
刘霄
杨爱民
-
机构
国网山西省电力公司超高压变电分公司
-
出处
《高压电器》
CAS
CSCD
北大核心
2023年第11期40-47,共8页
-
基金
2022年国网山西省电力公司科技项目资助(520510220005)。
-
文摘
语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱的特征参数,通过对参数分布的估计,能够有效地降低语音信息中的噪声干扰。为提升语音识别性能,文中设计一个端到端的语音识别模型。该模型基于卷积神经网络(CNN),并融合了CTC和注意力机制。CNN网络能够有效地捕捉语音数据中的局部模式和结构信息,而CTC和注意力机制在解码过程中起到关键作用。文中使用Aurora、Aishell以及运检语音数据集进行了实验评估,比较了语音降噪、语音识别同传统方法的效果。实验结果表明,所提出的语音识别模型取得了显著的性能提升,可为相关领域的研究和应用提供有价值的参考。
-
关键词
智能运检
语音识别
声音谱特性
分布估计
卷积神经网络
-
Keywords
intelligent operation and maintenance
speech recognition
sound spectrogram features
distribution estimation
CNN
-
分类号
TM63
[电气工程—电力系统及自动化]
TN912.34
[电子电信—通信与信息系统]
-