音符起始点是音乐特征信息中最基础的特征,也是高级音乐分析任务(如基频估计、节奏分析、节拍跟踪等)的前提.然而,目前大多数音符起始点检测算法的研究对象多以西洋乐(如钢琴、小提琴等)或人声为主,针对中国民乐的研究极为匮乏,其主要...音符起始点是音乐特征信息中最基础的特征,也是高级音乐分析任务(如基频估计、节奏分析、节拍跟踪等)的前提.然而,目前大多数音符起始点检测算法的研究对象多以西洋乐(如钢琴、小提琴等)或人声为主,针对中国民乐的研究极为匮乏,其主要原因是缺少高质量的带标注的数据集.为此,本文采集了古筝的部分考级曲目的音频,并在专家指导下对音符起始点加以标注,率先构建了一个带标签的包含3529条记录的古筝音符起始点数据集.此外,由于传统的神经网络特征预处理方法无法凸显古筝音符的起始点特征,本文提出了一种新型的特征平滑处理方法ELES(Extremum filtering based envelope smoothing),对训练数据的均值和标准差进行平滑处理,再经过标准化方法强化起始点特征,随后送入卷积神经网络进行训练.实验证明本文方法的准确性优于传统的基于音频信号处理的方法,并能够有效地检测出古筝的特殊技法和连续十六分音符的起始点.展开更多
文摘音符起始点是音乐特征信息中最基础的特征,也是高级音乐分析任务(如基频估计、节奏分析、节拍跟踪等)的前提.然而,目前大多数音符起始点检测算法的研究对象多以西洋乐(如钢琴、小提琴等)或人声为主,针对中国民乐的研究极为匮乏,其主要原因是缺少高质量的带标注的数据集.为此,本文采集了古筝的部分考级曲目的音频,并在专家指导下对音符起始点加以标注,率先构建了一个带标签的包含3529条记录的古筝音符起始点数据集.此外,由于传统的神经网络特征预处理方法无法凸显古筝音符的起始点特征,本文提出了一种新型的特征平滑处理方法ELES(Extremum filtering based envelope smoothing),对训练数据的均值和标准差进行平滑处理,再经过标准化方法强化起始点特征,随后送入卷积神经网络进行训练.实验证明本文方法的准确性优于传统的基于音频信号处理的方法,并能够有效地检测出古筝的特殊技法和连续十六分音符的起始点.