-
题名一种改进窗函数的低时延语音增强算法
被引量:2
- 1
-
-
作者
吴君钦
王迎福
-
机构
江西理工大学信息工程学院
-
出处
《计算机仿真》
北大核心
2022年第2期203-211,共9页
-
基金
国家自然科学基金(61741109)。
-
文摘
语音增强技术作为语音数字信号处理前端的预处理技术,在提高语音的可懂度和总体感知质量等方面扮演着重要角色。而以短时傅里叶变换为基础的语音增强算法会产生窗大小加跳数的算法延时,通常在考虑窗口大小和频谱分辨率后,算法的固有时延会大于64ms。然而,这样的高时延对于包括助听器在内的一些实时性要求较高的应用是很难满足的。为解决上述问题,对传统汉宁窗进行了改进,提出一种非对称的窗函数,并将其与无监督GCC-NMF算法相结合得到了一种无监督的两通道低时延的GCC-NMF语音增强算法。通过从SiSEC获取的语音和现实噪声的两通道混合信号数据集上进行性能评估。使用PEASS和BSS Eval工具包分别使用基于感知、基于SNR进行度量,同时使用STOI和ESTOI对语音的清晰度进行评测。最后,将上述方法与对称窗方法以及其它无监督的语音增强方法进行比较。结果证明,所提出的方法不仅能够将算法时延降低至2ms,还能保持各项评估指标均优于其它无监督以及对称窗方法。
-
关键词
语音增强
非负矩阵分解
非对称窗
广义互相关
低时延
-
Keywords
Speech enhancement
NMF
Asymmetric window
GCC
Low latency
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名基于GCC-NMF的语音分离研究
被引量:1
- 2
-
-
作者
吴君钦
王迎福
-
机构
江西理工大学信息工程学院
-
出处
《江西理工大学学报》
CAS
2020年第5期65-72,共8页
-
基金
国家自然科学基金资助项目(61741109)。
-
文摘
为了使盲源分离算法能更好地应用于一些实际噪声和训练数据较少且不需要做标记的环境,文章提出了一种无监督的非负矩阵字典学习方法。该方法对混合信号进行字典学习,随后在每个时间点上根据其空间源对字典原子进行分组来实现分离。通过从SiSEC获取语音和现实噪声的两通道混合信号作为数据集,使用PEASS和BSS Eval工具包分别基于感知、基于SNR和PEMO-Q的度量来量化性能。此外,还评估模型了参数对分离质量的影响,并将该方法与其他无监督和半监督的语音分离方法进行比较。结果证明,GCC-NMF是一种灵活的源分离算法,在3种评估参数中的每个参数均胜过特定任务的方法,包括盲源以及需要先验知识或信息的多种已知方法。
-
关键词
盲源分离
非负矩阵分解
听觉场景分析
广义互相关
字典学习
-
Keywords
blind source separation
NMF
CASA
GCC
dictionary learning
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名浅谈现浇钢筋混凝土楼面板裂缝的预防与控制
- 3
-
-
作者
王迎福
-
机构
深圳市中行建没监理有限公司
-
出处
《建筑与预算》
2010年第5期66-66,共1页
-
文摘
现浇钢筋混凝土楼面裂缝,是很难控制的施工质量通病,本文中对现浇钢筋混凝土楼面板裂缝的控制措施进行探讨和研究。
-
关键词
钢筋混凝土
裂缝
技术控制
-
分类号
TU765
[建筑科学—建筑技术科学]
-
-
题名对水下混凝土灌注桩施工技术质量控制工艺的研究
- 4
-
-
作者
王迎福
-
机构
深圳市中行建设监理有限公司
-
出处
《经济技术协作信息》
2010年第18期176-176,共1页
-
文摘
本文立足于实践经验,提出水下混凝土灌注桩施工前的准备工作技术内容和施工工艺的技术质量控制措施,论述了水下混凝土灌注桩施工应注意的问题,为水下混凝土灌注桩施工技术质量控制提供了参考.
-
关键词
施工准备
混凝土灌注桩
技术质量控制
-
分类号
F426.9
[经济管理—产业经济]
-