摘要
语音识别是一门新兴的交叉性学科,2011年8月微软亚洲研究院通过引入DNN(深度神经网络)以后,语音识别准确率得到大幅提高,进入飞速发展时期。受清华大学CSLT实验室发表的"语音信号深度因子分解"的文章启发,本实验将利用Python代码提取语音信号的幅度谱和相位谱,然后利用CSLT实验中使用深度神经网络将语音信号分解的3个谱:speaker,phone和emotion,同相位谱一起生成一个新的语音信号,进行语音转换。本实验将因子分解的方法应用于语音转换技术,可转换说话人身份从而进行保密工作,还可使变声需求得到更高品质的满足。
出处
《中国新技术新产品》
2018年第17期137-139,共3页
New Technology & New Products of China