期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于MFCC和常数Q变换的乐器音符识别 被引量:10
1
作者 陈燕文 李坤 +1 位作者 韩焱 王燕平 《计算机科学》 CSCD 北大核心 2020年第3期149-155,共7页
音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基... 音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基频的增大将导致误差增大,可识别的音符基频范围不广。为此,文中采用分类的思想进行音符识别。首先,建立所需识别的音符音频库,并针对音乐信号低频信息的重要性,选取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)和常数Q变换(Constant Q Transform,CQT)作为音符信号提取特征。然后,将提取的特征MFCC和CQT分别作为音符识别的单一特征输入和两者特征融合输入;结合Softmax回归模型在多分类问题中的优势以及BP神经网络良好的非线性映射能力与自学习能力,构建基于Softmax回归模型的BP神经网络多分类识别器。在MATLAB R2016a的仿真环境下,将特征参数输入到多分类器中进行学习与训练,通过调整网络参数来寻找最优解。通过改变训练样本数进行对比实验。实验结果表明,将融合特征(MFCC+CQT)作为特征输入时,可以识别出从大字组到小字三组的25类音符,并可以获得95.6%的平均识别率;在识别过程中,特征CQT比特征MFCC的贡献更大。实验数据充分说明,利用分类的思想提取音符信号的MFCC和CQT特征来进行音符识别,可以取得很好的识别效果,并且不受音符基频范围的限制。 展开更多
关键词 音符库 MFCC 常数q变换 特征融合 Softmax回归模型 BP神经网络
下载PDF
基于二维主成分分析法的变压器声纹特征参数融合方法 被引量:2
2
作者 孙安青 贾廷波 +3 位作者 王丰华 杨秀龙 岳美 许景华 《广东电力》 2022年第9期127-134,共8页
运行中的变压器声信号以其非接触式测量、高灵敏度和强时效性等优点逐渐成为基于数据驱动模型的变压器状态监测领域的关注热点,如何从非平稳的声信号中获取合理有效及区分度高的声纹特征参数是变压器状态监测的关键。对此,在分别计算变... 运行中的变压器声信号以其非接触式测量、高灵敏度和强时效性等优点逐渐成为基于数据驱动模型的变压器状态监测领域的关注热点,如何从非平稳的声信号中获取合理有效及区分度高的声纹特征参数是变压器状态监测的关键。对此,在分别计算变压器声信号Mel频率倒谱系数和常Q倒谱系数特征参数的基础上,引入二维主成分分析法对这2种声纹特征参数进行融合降维,旨在降低数据维数的同时获取主要声纹特征,并以平均类间区分度表征声纹特征参数的区分度。某变压器不同直流偏磁状态下声信号的计算结果表明,所提出的变压器声信号特征参数表征方法更加全面高效且区分度高,可为变压器运行状态声信号监测技术提供重要参考。 展开更多
关键词 变压器 MEL频率倒谱系数 q倒谱系数 二维主成分分析法 声信号
下载PDF
基于多特征融合的乐器声品质评价方法研究
3
作者 陈燕文 李坤 +1 位作者 韩焱 王燕平 《测试技术学报》 2019年第5期421-427,共7页
在乐器声品质研究中,以往研究主要是从乐器的结构以及物理特性出发,忽略了乐音本身的重要性以及客观评价测量的不易实现性.为此,提出了一种基于多特征融合的乐器声品质评价方法.通过主观评价法获取乐器琵琶的声品质评价结果,建立具有主... 在乐器声品质研究中,以往研究主要是从乐器的结构以及物理特性出发,忽略了乐音本身的重要性以及客观评价测量的不易实现性.为此,提出了一种基于多特征融合的乐器声品质评价方法.通过主观评价法获取乐器琵琶的声品质评价结果,建立具有主观评价的乐音信号库作为实验对象;提取乐音信号的相关系数(CC)、常数Q变换(CQT)和梅尔频率倒谱系数(MFCC)作为单一特征输入,以及多特征融合输入;并构建基于BP神经网络的乐器声品质评价模型.实验结果表明,该方法可以很好地应用于乐器声品质评价. 展开更多
关键词 乐器声品质 主观评价 相关系数 MFCC 常数q变换 多特征融合 BP神经网络
下载PDF
基于ResNet的音频场景声替换造假的检测算法
4
作者 董明宇 严迪群 《计算机应用》 CSCD 北大核心 2022年第6期1724-1728,共5页
针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化... 针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果。在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100%,错误接收率最低仅为1.37%。在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27%。实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的。 展开更多
关键词 音频造假 音频场景声替换 残差网络 常数q频谱系数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部