期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于高低频带对数能量谱比贝叶斯决策的语音端点检测
被引量:
3
1
作者
张子丞
谭志苇
+3 位作者
张晨瑞
王旋
刘晓璇
俞一彪
《计算机科学》
CSCD
北大核心
2021年第S01期33-37,共5页
在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法。首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得...
在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法。首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得到两类信号对数能量谱比的统计分布,并基于贝叶斯决策准则推导最佳判决阈值。信号输入时,逐帧计算高低频带对数能量谱比并与判决阈值进行比较来进行语音和背景噪声的分类判决,从而实现语音信号的端点检测。实验结果表明,与传统的双门限检测法和谱熵检测法相比,提出的方法在较低信噪比条件下能更加准确地检测语音端点,明显提高了端点检测的准确率和速度。
展开更多
关键词
语音端点检测
对数能量谱比
贝叶斯决策
低信噪比
下载PDF
职称材料
一种新的对数能量谱熵语音端点检测方法
被引量:
17
2
作者
赵欢
王纲金
赵丽霞
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第7期72-77,共6页
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于...
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于能量谱熵(EE)法和对数能量(LE)法,在噪声环境下LESE法具有更好的检测性能,表现出更好的稳健性.当信噪比为-5 dB时,LESE法的检测错误率仅为18.02%,在信噪比为0~10 dB时,其检测错误率要明显低于EE法和LE法.
展开更多
关键词
语音处理
语音端点检测
对数
能量
谱
熵
能量
谱
熵
对数
能量
下载PDF
职称材料
融合多尺度特征与上下文信息的语音增强方法
3
作者
更藏措毛
黄鹤鸣
杨毅杰
《计算机工程》
CAS
CSCD
北大核心
2024年第6期138-147,共10页
在语音增强中,常用自编码器结构自动提取特征,但这样得到的特征单一或者冗余且不能较好地捕获语音信号的上下文依赖关系。因此,提出一种融合多尺度特征和上下文信息的语音增强方法MSF-CI。首先,利用多尺度卷积块提取语音信号的多尺度特...
在语音增强中,常用自编码器结构自动提取特征,但这样得到的特征单一或者冗余且不能较好地捕获语音信号的上下文依赖关系。因此,提出一种融合多尺度特征和上下文信息的语音增强方法MSF-CI。首先,利用多尺度卷积块提取语音信号的多尺度特征,解决特征单一问题;其次,利用注意力机制关注所提取特征的空间与通道关键信息,解决特征冗余问题;最后,使用门控卷积循环神经网络学习语音信号中跨度较长的上下文依赖关系,并通过门控线性单元提高该网络的非线性学习能力,从而提高模型的泛化性。实验结果表明,MSF-CI在低信噪比和不同噪声环境下增强语音信号的语音感知质量、短时客观可懂度等多个指标上均优于GRN、DPT-FSNet、U-Net等同类的单通道语音增强模型。在信噪比为0 dB时,该方法的平均语音感知质量和平均语音客观可懂度达到1.49和0.761。在构建的安多藏语语料库上验证模型的泛化性,平均语音感知质量和平均语音客观可懂度相对于噪声提高了20.7%和11.3%,MSF-CI模型不仅可以提升语音的质量与可理解度,而且具有较优的泛化性。
展开更多
关键词
语音增强
多尺度特征
注意力机制
门控卷积循环神经网络
对数
能量
谱
下载PDF
职称材料
题名
基于高低频带对数能量谱比贝叶斯决策的语音端点检测
被引量:
3
1
作者
张子丞
谭志苇
张晨瑞
王旋
刘晓璇
俞一彪
机构
苏州大学电子信息学院
出处
《计算机科学》
CSCD
北大核心
2021年第S01期33-37,共5页
文摘
在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法。首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得到两类信号对数能量谱比的统计分布,并基于贝叶斯决策准则推导最佳判决阈值。信号输入时,逐帧计算高低频带对数能量谱比并与判决阈值进行比较来进行语音和背景噪声的分类判决,从而实现语音信号的端点检测。实验结果表明,与传统的双门限检测法和谱熵检测法相比,提出的方法在较低信噪比条件下能更加准确地检测语音端点,明显提高了端点检测的准确率和速度。
关键词
语音端点检测
对数能量谱比
贝叶斯决策
低信噪比
Keywords
Speech endpoint detection
Logarithmic power spectrum ratio
Bayesian decision
Low SNR
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
一种新的对数能量谱熵语音端点检测方法
被引量:
17
2
作者
赵欢
王纲金
赵丽霞
机构
湖南大学计算机与通信学院
出处
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第7期72-77,共6页
基金
湖南省科技计划资助项目(05FJ3046)
湖南省科技计划重点资助项目(2007GK2015)
文摘
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于能量谱熵(EE)法和对数能量(LE)法,在噪声环境下LESE法具有更好的检测性能,表现出更好的稳健性.当信噪比为-5 dB时,LESE法的检测错误率仅为18.02%,在信噪比为0~10 dB时,其检测错误率要明显低于EE法和LE法.
关键词
语音处理
语音端点检测
对数
能量
谱
熵
能量
谱
熵
对数
能量
Keywords
speech processing
voice activity detection
log energy spectral entropy
energy spectral entropy
logarithmic energy
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
融合多尺度特征与上下文信息的语音增强方法
3
作者
更藏措毛
黄鹤鸣
杨毅杰
机构
青海师范大学计算机学院
藏语智能信息处理及应用国家重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第6期138-147,共10页
基金
青海省基础研究计划项目(2022-ZJ-925)
国家自然科学基金(62066039)
+1 种基金
省部共建藏语智能信息处理及应用国家重点实验室自主课题(2022-SKL-002,2022-SKL-007)
2021年青海师范大学自然科学中青年项目科研基金(KJQN2021001)。
文摘
在语音增强中,常用自编码器结构自动提取特征,但这样得到的特征单一或者冗余且不能较好地捕获语音信号的上下文依赖关系。因此,提出一种融合多尺度特征和上下文信息的语音增强方法MSF-CI。首先,利用多尺度卷积块提取语音信号的多尺度特征,解决特征单一问题;其次,利用注意力机制关注所提取特征的空间与通道关键信息,解决特征冗余问题;最后,使用门控卷积循环神经网络学习语音信号中跨度较长的上下文依赖关系,并通过门控线性单元提高该网络的非线性学习能力,从而提高模型的泛化性。实验结果表明,MSF-CI在低信噪比和不同噪声环境下增强语音信号的语音感知质量、短时客观可懂度等多个指标上均优于GRN、DPT-FSNet、U-Net等同类的单通道语音增强模型。在信噪比为0 dB时,该方法的平均语音感知质量和平均语音客观可懂度达到1.49和0.761。在构建的安多藏语语料库上验证模型的泛化性,平均语音感知质量和平均语音客观可懂度相对于噪声提高了20.7%和11.3%,MSF-CI模型不仅可以提升语音的质量与可理解度,而且具有较优的泛化性。
关键词
语音增强
多尺度特征
注意力机制
门控卷积循环神经网络
对数
能量
谱
Keywords
speech enhancement
multi-scale feature
attention mechanism
Gated Convolutional Recurrent Neural(GCRN)network
Logarithmic Power Spectrum(LPS)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于高低频带对数能量谱比贝叶斯决策的语音端点检测
张子丞
谭志苇
张晨瑞
王旋
刘晓璇
俞一彪
《计算机科学》
CSCD
北大核心
2021
3
下载PDF
职称材料
2
一种新的对数能量谱熵语音端点检测方法
赵欢
王纲金
赵丽霞
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
17
下载PDF
职称材料
3
融合多尺度特征与上下文信息的语音增强方法
更藏措毛
黄鹤鸣
杨毅杰
《计算机工程》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部