-
题名基于预处理的DOA估计和基频双输入的语音分割
- 1
-
-
作者
王玫
成家礼
-
机构
桂林电子科技大学认知无线电与信息处理省部共建教育部重点实验室
桂林理工大学物理与电子信息工程学院
-
出处
《桂林电子科技大学学报》
2024年第4期348-354,共7页
-
基金
国家自然科学基金(62071135)
广西自然科学基金(2019GXNSFBA245103)
桂林电子科技大学研究生教育创新计划(2021YCXS037)。
-
文摘
语音分割是语音分离系统的一个重要组成部分,它在信源估计和多说话人环境中的自动语音识别、多声源目标跟踪等许多应用中都起着重要的作用,重叠语音的分割一直都是这项工作的重点。在实际生活中,室内的麦克风采集的语音信号通常都包含混响和噪声信号,它们使接收信号的语音质量变差,影响了波达方向估计特征的精度,导致多声源重叠语音的分割性能下降。针对现有的多声源分割方法对噪声和混响信号鲁棒性差的问题,提出了一种通过预处理来消除语音信号中的明显异常噪声和混响信号的方法。该方法使用广义旁瓣相消器和维纳滤波器实现的后滤波器相结合对原始语音信号进行处理,消除了混响和噪声信号,使语音质量得到了提高,进而使波达方向特征估计更加准确。最后用多假设跟踪同时跟踪说话人的基频特征和波达方向特征来进行分割,以多声源重叠语音为例,对AMI语料库中的16个会议音频进行了统计与分析,结果表明,与未进行预处理的方法相比,平均命中率(HIT)提高了2.10%。
-
关键词
语音分割
广义旁瓣相消器
维纳滤波器
波达方向
多假设跟踪
基频
-
Keywords
speech segmentation
generalized sidelobe canceller
Wiener filter
direction of arrival
multiple hypothesis tracking
fundamental frequency
-
分类号
TN911.7
[电子电信—通信与信息系统]
TP391.4
[自动化与计算机技术—计算机应用技术]
-