期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于时频感知神经网络的语音频带扩展
被引量:
1
1
作者
许春冬
凌贤鹏
+1 位作者
应冬文
王晶
《信号处理》
CSCD
北大核心
2021年第10期2004-2012,共9页
为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编...
为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编解码器内部使用了时间卷积网络,有效提升了模型对语音时序数据上下文依赖关系的学习能力。为了促进模型朝更加准确的方向训练,还提出了一种时频感知损失函数,有利于模型在时域、频域以及感知域获取窄带语音到宽带语音的最优映射解。通过主观和客观实验结果表明,该方法优于传统方法和近几年基于深度神经网络的语音频带扩展方法。
展开更多
关键词
语音频带扩展
时间卷积网络
时频
感知目标
损失
局部敏感哈希注意力机制
下载PDF
职称材料
基于Flatten-CNN的语音带宽扩展研究
被引量:
2
2
作者
杨俊美
雷杨
陈习坤
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2021年第11期87-94,共8页
现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问...
现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问题,文中提出了一种基于Flatten-CNN的语音带宽扩展算法。首先,为了充分利用语音特征和减少数据量,文中算法基于频域运行;其次,为了利用对数功率谱时间轴信息,提出了一种改进的编码器,通过引入平铺层,实现对数功率谱时频两轴特征提取;接着,为了加深网络深度,在频率轴数据处理时去掉最后一个点,还原时再补零,使频率轴数为偶数,以利于加深网络深度;最后,为了利用语音信号时域信息,在损失函数中引入时域损失。为验证文中算法的有效性,用TIMIT数据集和VCTK数据集进行了模型的训练和测试,实验结果表明,与当前主流算法相比,文中算法生成的高带宽语音质量得到提高,呈现出了更好的听觉效果。
展开更多
关键词
语音带宽扩展
平铺层
时频
两轴特征提取
时频损失
网络深度
下载PDF
职称材料
基于多尺度特征融合的语音频带扩展
3
作者
许春冬
朱诚
+1 位作者
应冬文
董桂官
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第9期132-139,共8页
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射...
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法.
展开更多
关键词
语音频带扩展
深度学习
自注意力机制
时频
感知
损失
函数
原文传递
题名
基于时频感知神经网络的语音频带扩展
被引量:
1
1
作者
许春冬
凌贤鹏
应冬文
王晶
机构
江西理工大学信息工程学院
北京理工大学信息与电子学院
出处
《信号处理》
CSCD
北大核心
2021年第10期2004-2012,共9页
基金
国家自然科学基金项目(11864016,61671442)
江西省文化艺术项目(YG2017384)
江西理工大学研究生创新专项资金项目(ZS2019-S080)。
文摘
为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编解码器内部使用了时间卷积网络,有效提升了模型对语音时序数据上下文依赖关系的学习能力。为了促进模型朝更加准确的方向训练,还提出了一种时频感知损失函数,有利于模型在时域、频域以及感知域获取窄带语音到宽带语音的最优映射解。通过主观和客观实验结果表明,该方法优于传统方法和近几年基于深度神经网络的语音频带扩展方法。
关键词
语音频带扩展
时间卷积网络
时频
感知目标
损失
局部敏感哈希注意力机制
Keywords
speech bandwidth extension
temporal convolutional networks
time-frequency perception loss
local sensitive hash attention mechanism
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于Flatten-CNN的语音带宽扩展研究
被引量:
2
2
作者
杨俊美
雷杨
陈习坤
机构
华南理工大学电子与信息学院
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2021年第11期87-94,共8页
基金
国家自然科学基金资助项目(61871188,61801133)。
文摘
现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问题,文中提出了一种基于Flatten-CNN的语音带宽扩展算法。首先,为了充分利用语音特征和减少数据量,文中算法基于频域运行;其次,为了利用对数功率谱时间轴信息,提出了一种改进的编码器,通过引入平铺层,实现对数功率谱时频两轴特征提取;接着,为了加深网络深度,在频率轴数据处理时去掉最后一个点,还原时再补零,使频率轴数为偶数,以利于加深网络深度;最后,为了利用语音信号时域信息,在损失函数中引入时域损失。为验证文中算法的有效性,用TIMIT数据集和VCTK数据集进行了模型的训练和测试,实验结果表明,与当前主流算法相比,文中算法生成的高带宽语音质量得到提高,呈现出了更好的听觉效果。
关键词
语音带宽扩展
平铺层
时频
两轴特征提取
时频损失
网络深度
Keywords
speech bandwidth extension
tile layer
time-frequency two-axis feature extraction
time-frequency loss
network depth
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多尺度特征融合的语音频带扩展
3
作者
许春冬
朱诚
应冬文
董桂官
机构
江西理工大学信息工程学院
中国科学院大学电子电气与通信工程学院
中国电子技术标准化研究院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第9期132-139,共8页
基金
国家自然科学基金资助项目(11864016)
江西省科技厅重点研发计划资助项目(20202BBEL53006).
文摘
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法.
关键词
语音频带扩展
深度学习
自注意力机制
时频
感知
损失
函数
Keywords
speech bandwidth extension
deep learning
self-attentional mechanism
time-frequency perception loss function
分类号
TP912.3 [自动化与计算机技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于时频感知神经网络的语音频带扩展
许春冬
凌贤鹏
应冬文
王晶
《信号处理》
CSCD
北大核心
2021
1
下载PDF
职称材料
2
基于Flatten-CNN的语音带宽扩展研究
杨俊美
雷杨
陈习坤
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2021
2
下载PDF
职称材料
3
基于多尺度特征融合的语音频带扩展
许春冬
朱诚
应冬文
董桂官
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部