-
题名基于改进卷积神经网络与听觉谱图的乐器识别
被引量:3
- 1
-
-
作者
王飞
于凤芹
-
机构
江南大学物联网工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第1期199-205,共7页
-
基金
国家自然科学基金(61703185)
-
文摘
针对传统乐器识别需要音乐的低级声频特征及识别性能依赖特征选取的问题,利用接近人耳感知且低冗余度的听觉谱图作为5层深度卷积网络的输入,逐层抽象出音色的高级时频表示用于乐器识别。为有效捕获听觉谱图中的时频信息,将卷积网络第1层矩形卷积核改进为频率、时间轴上的多尺度卷积核。在IOWA乐器库上进行的仿真实验结果表明,该神经网能获得96. 95%的识别准确率,优于使用单一卷积核的神经网,在相同的网络结构下,基于听觉谱图得到的识别准确率较基于梅尔频率倒谱系数(MFCC)、语谱图分别高出9. 11%、3. 54%,且对打击乐器与同族乐器的错分率均较小。
-
关键词
听觉谱图
卷积神经网络
卷积核
时频特征
乐器识别
-
Keywords
auditory spectrum
Convolutional Neural Network(CNN)
convolution kernel
time-frequency feature
musical instrument identification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名不同乐器结构音色的识别研究
被引量:1
- 2
-
-
作者
汪洋
-
机构
沈阳音乐学院
-
出处
《景德镇学院学报》
2023年第3期29-34,共6页
-
基金
辽宁省普通高等教育本科教学改革研究项目(3-31017705)。
-
文摘
为提高对不同乐器结构音色识别的准确率,提出一种去噪自编码器(Denoising Autoencoder,DA)结合受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的音色识别方法。该方法通过DA网络和RBM网络构建DA-RBM的识别模型,以实现对不同乐器结构音色的识别。仿真结果表明,本文所提基于DA-RBM模型的识别方法在识别准确率和模型训练时长等指标上均具有一定的优势,有效提升了不同乐器结构音色识别的准确率。
-
关键词
乐器音色分析
去噪自编码器
受限玻尔兹曼机
听觉谱图
-
Keywords
analysis of musical instrument timbre
denoising autoencoder
restricted Boltzmann machine
auditory spectrogram
-
分类号
J632
[艺术—音乐]
-
-
题名结合多尺度时频调制与多线性主成分分析的乐器识别
被引量:2
- 3
-
-
作者
王飞
于凤芹
-
机构
江南大学物联网工程学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第3期891-894,910,共5页
-
文摘
针对目前时域频域特征、倒谱特征、稀疏特征、概率特征对同族乐器错分率高且对打击乐器识别不佳的问题,提出一种提取时频信息且低冗余度的模型用于乐器识别。首先利用耳蜗模型对乐音进行谐波分解,生成接近人耳感知且包含时频信息的听觉谱图(AS);随后利用多尺度滤波器对听觉谱图多尺度时频调制(MTFM)以观测时频的变化;最后利用多线性主成分分析(MPCA)对调制输出在保留数据内在相关的前提下降维,并使用支持向量机(SVM)分类。仿真实验表明,该方法在IOWA数据库上取得92.74%的正确率,对打击乐器与同族乐器的错分率分别为3%与9.12%,均优于上述特征。相比主成分分析(PCA)降维,MPCA提高识别准确率6.43%。因此,该模型适用于对同族乐器与打击乐器的识别。
-
关键词
多尺度时频调制
多线性主成分分析
听觉谱图
支持向量机
乐器识别
-
Keywords
Multiscale Time-Frequency Modulation (MTFM)
Multilinear Principal Component Analysis (MPCA)
Auditory Spectrum (AS)
Support Vector Machine (SVM)
musical instrument identification
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-