-
题名基于生成对抗网络去影像的多基频估计算法
被引量:3
- 1
-
-
作者
黎思泉
万永菁
蒋翠玲
-
机构
华东理工大学信息科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2022年第3期179-184,共6页
-
文摘
多基频估计被广泛应用于音乐结构分析、乐音辅助教育、信息检索等各个领域。为了满足准确识别乐曲中随机和弦的需求,提出了基于生成对抗网络去影像的多基频估计算法。首先将完整音频切分成音符段,提出了一种谐音指纹图提取音符段频谱特征;然后通过卷积神经网络识别谐音指纹图当前的主导基频,将已识别出的主导基频作为干扰下一个基频识别的影像,并通过生成对抗网络去除干扰影像,对已去除干扰影像后的谐音指纹图进行新一轮的多基频估计;最后通过逐级迭代去影像操作实现完整和弦的多基频估计。对随机二音和弦及随机三音和弦组成的钢琴音频数据库进行实验,结果表明,所提算法与经典频谱迭代删除算法和大型词袋和弦识别算法相比,能够适应随机和弦的识别,在不同的音域范围内鲁棒性高,整体正确率有明显提升。
-
关键词
多基频估计
谐音指纹图
生成对抗网络
卷积神经网络
基频影像
-
Keywords
Multiple fundamental frequency estimation
Homophonic fingerprint
Generative adversarial networks
Convolution neural network
Fundamental frequency image
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种融合时频信息的钢琴音符端点检测算法
- 2
-
-
作者
黎思泉
王泓程
顾思恒
张杰霖
万永菁
-
机构
华东理工大学信息科学与工程学院
-
出处
《科技与创新》
2018年第13期41-44,共4页
-
文摘
准确的音符端点检测是乐音识别的重要基础。针对端点检测算法中误识别的情况,提出了一种融合时频信息的钢琴音符端点检测算法,先通过能量峰值求出可能的音符起始点,用键号频谱的形式表示音频的频谱特征,再通过余弦相似度和曼哈顿距离筛选音符端点,在不需要音色先验知识的情况下实现音符切分。实验表明,融合时频信息进行音符端点筛选能够有效提高音符端点检测的精度。
-
关键词
端点检测
时频信息
键号频谱
余弦相似度
-
分类号
TN912.3
[电子电信—通信与信息系统]
-