摘要
日前,谷歌和位于Switeizland的Idiap研究所的研究人员在Aixiv上发表了一篇论文,描述了他们训练的两个独立的神经网络——说话者识别网络(a speaker recognition networic)和声谱掩码网络(a spectrogram masking network),这两个网络一起显著降低了多说话者信号的语音识别词错误率(WER)。在此论文中,研究人员写道:“我们的任务是将一部分感兴趣的说话者的声音与所有其他说话者的声音共性分离开来。
出处
《中国信息界》
2018年第5期61-61,共1页
Information China