随着人工智能物联网(artificial intelligence&internet of things,AIoT)的发展,硬件技术的飞速进步,更多的智能音箱进入人们的生活,人机交互方式也从早期的遥控变成了人声控制.但设备中麦克风采集到的语音信号往往含有大量噪声和...随着人工智能物联网(artificial intelligence&internet of things,AIoT)的发展,硬件技术的飞速进步,更多的智能音箱进入人们的生活,人机交互方式也从早期的遥控变成了人声控制.但设备中麦克风采集到的语音信号往往含有大量噪声和干扰人声,为此需对麦克风采集到的语音进行语音分离处理.常用的技术有频域独立成分分析(independent component analysis,ICA),但是频域ICA存在次序不确定性问题,即将分离出的源1分量分类到源2通道,将分离出的源2分量分类到源1通道,从而导致分离性能大大降低.为此,提出一种基于语音能量比来解决频域ICA中次序不确定性问题的算法,有效地提高了分离性能.在SiSEC(Signal Separation Evaluation Campaign)、ChiME(Challenge for Computational Hearing in Multisoure Environments)数据集上对分离性能进行实验,所得结果比已有算法均有提升,且针对强混响环境下的混合信号依然保持良好的分离性能.展开更多
文摘随着人工智能物联网(artificial intelligence&internet of things,AIoT)的发展,硬件技术的飞速进步,更多的智能音箱进入人们的生活,人机交互方式也从早期的遥控变成了人声控制.但设备中麦克风采集到的语音信号往往含有大量噪声和干扰人声,为此需对麦克风采集到的语音进行语音分离处理.常用的技术有频域独立成分分析(independent component analysis,ICA),但是频域ICA存在次序不确定性问题,即将分离出的源1分量分类到源2通道,将分离出的源2分量分类到源1通道,从而导致分离性能大大降低.为此,提出一种基于语音能量比来解决频域ICA中次序不确定性问题的算法,有效地提高了分离性能.在SiSEC(Signal Separation Evaluation Campaign)、ChiME(Challenge for Computational Hearing in Multisoure Environments)数据集上对分离性能进行实验,所得结果比已有算法均有提升,且针对强混响环境下的混合信号依然保持良好的分离性能.