期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
复杂噪声环境下基于轻量化模型的车内交互语音增强和识别方法
1
作者
廉筱峪
夏楠
+1 位作者
戴高乐
杨红琴
《电子学报》
EI
CAS
CSCD
北大核心
2024年第4期1282-1287,共6页
针对车内语音交互在复杂噪声环境下识别率低以及难以在有限计算资源设备上部署问题,本文设计了轻量化的语音增强模型和语音识别模型并进行联合训练.语音增强模型引入多尺度通道时频注意力模块来提取多尺度时频特征和各个维度上的关键信...
针对车内语音交互在复杂噪声环境下识别率低以及难以在有限计算资源设备上部署问题,本文设计了轻量化的语音增强模型和语音识别模型并进行联合训练.语音增强模型引入多尺度通道时频注意力模块来提取多尺度时频特征和各个维度上的关键信息.在语音识别模型中提出了多头逐元素线性注意力,显著降低了注意力模块所需的计算复杂度.实验表明,在自制数据集上这一联合训练模型表现出良好的噪声鲁棒性.
展开更多
关键词
深度学习
语音增强
语音识别
注意力机制
联合训练
下载PDF
职称材料
题名
复杂噪声环境下基于轻量化模型的车内交互语音增强和识别方法
1
作者
廉筱峪
夏楠
戴高乐
杨红琴
机构
大连工业大学信息科学与工程学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第4期1282-1287,共6页
基金
教育部产学合作协同育人项目(No.220603231024713)。
文摘
针对车内语音交互在复杂噪声环境下识别率低以及难以在有限计算资源设备上部署问题,本文设计了轻量化的语音增强模型和语音识别模型并进行联合训练.语音增强模型引入多尺度通道时频注意力模块来提取多尺度时频特征和各个维度上的关键信息.在语音识别模型中提出了多头逐元素线性注意力,显著降低了注意力模块所需的计算复杂度.实验表明,在自制数据集上这一联合训练模型表现出良好的噪声鲁棒性.
关键词
深度学习
语音增强
语音识别
注意力机制
联合训练
Keywords
deep learning
speech enhancement
speech recognition
attention mechanism
joint training
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
复杂噪声环境下基于轻量化模型的车内交互语音增强和识别方法
廉筱峪
夏楠
戴高乐
杨红琴
《电子学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部