一、相关背景《宋代佛教》(Buddhism in the Sung)一书的主要编者是美国史密斯学院"宗教与东亚研究"荣誉教授Peter N.Gregory(彼得·N·格雷戈里),本书的另一位编者是布拉德利大学Daniel A.Getz(丹尼尔·A·...一、相关背景《宋代佛教》(Buddhism in the Sung)一书的主要编者是美国史密斯学院"宗教与东亚研究"荣誉教授Peter N.Gregory(彼得·N·格雷戈里),本书的另一位编者是布拉德利大学Daniel A.Getz(丹尼尔·A·盖茨)副教授。本书已有两篇英文书评与一篇德语书评~①,目前尚未见到中文书评。展开更多
为提高歌声识别准确率,提出一种基于Transformer并带有纠正模型的歌声识别方法TSC(transformer with spelling correction)。利用注意力机制,使网络学习对应的歌词发音。在模型输入模块,增加由卷积神经网络组成的特征提取层,提取歌声特...为提高歌声识别准确率,提出一种基于Transformer并带有纠正模型的歌声识别方法TSC(transformer with spelling correction)。利用注意力机制,使网络学习对应的歌词发音。在模型输入模块,增加由卷积神经网络组成的特征提取层,提取歌声特征。在输出模块后面,增加由卷积神经网络和双向循环神经网络组成的纠正模型,修正模型的输出结果。针对歌声样本量较少,模型训练困难的问题,提出了使用汉语语音数据集AISHELL-1进行预训练,并自制一组数据进行数据增强,对歌声识别模型参数进行微调。在增强的Opencpop歌声数据集上进行实验的结果表明,提出的歌声识别系统的字错率降低到了31.92%。展开更多
文摘一、相关背景《宋代佛教》(Buddhism in the Sung)一书的主要编者是美国史密斯学院"宗教与东亚研究"荣誉教授Peter N.Gregory(彼得·N·格雷戈里),本书的另一位编者是布拉德利大学Daniel A.Getz(丹尼尔·A·盖茨)副教授。本书已有两篇英文书评与一篇德语书评~①,目前尚未见到中文书评。
文摘为提高歌声识别准确率,提出一种基于Transformer并带有纠正模型的歌声识别方法TSC(transformer with spelling correction)。利用注意力机制,使网络学习对应的歌词发音。在模型输入模块,增加由卷积神经网络组成的特征提取层,提取歌声特征。在输出模块后面,增加由卷积神经网络和双向循环神经网络组成的纠正模型,修正模型的输出结果。针对歌声样本量较少,模型训练困难的问题,提出了使用汉语语音数据集AISHELL-1进行预训练,并自制一组数据进行数据增强,对歌声识别模型参数进行微调。在增强的Opencpop歌声数据集上进行实验的结果表明,提出的歌声识别系统的字错率降低到了31.92%。