摘要
针对汉语普通话声调的识别,采用声谱图表示声音频率信息的方法代替传统比较单一的特征提取,同时基于巨量数据和深度学习的方式,获得了可观的识别率。声调的频率特性以及不同频率之间的空间结构在声谱图中均可以得到很好的表示,同时利用深度学习中卷积神经网络模型,对声谱图进行训练学习,获取与声调相联系的大量频率特征,进而使得声调识别率得到提高,其中在验证样本集合数量为96511时,识别率为98.5%。
出处
《信息通信》
2017年第7期89-92,共4页
Information & Communications