期刊文献+
共找到821篇文章
< 1 2 42 >
每页显示 20 50 100
基于特征融合和B-SVM的鸟鸣声识别算法 被引量:1
1
作者 陈晓 曾昭优 《声学技术》 CSCD 北大核心 2024年第1期119-126,共8页
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。... 为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。 展开更多
关键词 鸟鸣声识别 梅尔频率倒谱系数 线性判别算法 黑寡妇优化算法 支持向量机
下载PDF
基于模态理论和改进GMM的声发射源识别研究
2
作者 杨勇 李晶 +1 位作者 朱作付 邓艾东 《电子器件》 CAS 2024年第1期128-133,共6页
基于模态声发射信号理论,提出了一种利用声学对数倒谱统计参数作为声发射信号特征参数的分析与提取方法。从声发射信号多模态特性出发,提出了一个基于改进高斯混合模型的声发射源信号识别系统。理论分析和实验结果表明,该方法能准确地... 基于模态声发射信号理论,提出了一种利用声学对数倒谱统计参数作为声发射信号特征参数的分析与提取方法。从声发射信号多模态特性出发,提出了一个基于改进高斯混合模型的声发射源信号识别系统。理论分析和实验结果表明,该方法能准确地判断声发射信号源,不仅能够应用于突发型声发射信号的识别,而且可以应用于连续型声发射信号的识别。 展开更多
关键词 声发射信号 倒谱 高斯混合模型 识别
下载PDF
基于MFCC和GMM的瓷砖空鼓率识别系统及方法
3
作者 周浩 梁军汀 卢杰 《无损检测》 CAS 2024年第3期28-32,55,共6页
针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试... 针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试验结果表明,采用MFCC和GMM相结合的方法,可以对瓷砖空鼓情况进行有效识别,该方法具有良好的应用前景。 展开更多
关键词 声纹识别 梅尔倒谱系数 混合高斯模型
下载PDF
梅尔频率倒谱系数在声带息肉手术前后嗓音分析中的价值研究
4
作者 刘茉 葛鑫颖 +2 位作者 赵晓畅 郝青青 李祖飞 《中国耳鼻咽喉颅底外科杂志》 CAS CSCD 2024年第2期102-105,共4页
目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年... 目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年龄(42.9±11.4)岁。另选取无声嘶且无声带病变的正常受试者21例作为基线对照。使用基于Python编程语言的librosa语音处理包进行MFCC特征提取,分别提取每位患者的MFCC均值,MFCC方差与MFCC标准差,使用配对样本t检验比较声带息肉手术前后上述各MFCC特征的差异。结果 声带息肉患者术后MFCC均值1.25±1.01、MFCC方差561.34±154.98及MFCC标准差21.74±4.03比术前MFCC均值6.81±2.05、MFCC方差1 019.66±295.87及MFCC标准差34.37±6.63显著下降,差异具有统计学意义(t=18.596,P=0.000;t=10.338,P=0.000;t=11.852,P=0.000)。声带息肉组患者术后1个月其MFCC均值、MFCC方差及MFCC标准差与正常受试者相比差异均无统计学意义,表明绝大部分声带息肉患者术后嗓音得到良好的恢复。结论 本研究首次探索了MFCC在声带息肉手术前后嗓音分析中的价值,MFCC各特征可作为评估声带息肉术后嗓音恢复的指标。 展开更多
关键词 声带息肉 声嘶 梅尔频率倒谱系数 嗓音分析 手术
下载PDF
基于倒谱分析的弦乐和打击乐的源分离
5
作者 吴礼福 孙芯年 《计算机与数字工程》 2024年第8期2524-2529,共6页
针对音乐中弦乐和打击乐的分离(Harmonic Percussive Sound Separation,HPSS)问题,基于弦乐在时域上跨度长、频域上分布窄,而打击乐在时域上跨度短、频域上分布宽的特点,论文研究了一种倒谱滤波加后处理的分离方法。该方法在倒谱域设计... 针对音乐中弦乐和打击乐的分离(Harmonic Percussive Sound Separation,HPSS)问题,基于弦乐在时域上跨度长、频域上分布窄,而打击乐在时域上跨度短、频域上分布宽的特点,论文研究了一种倒谱滤波加后处理的分离方法。该方法在倒谱域设计滤波器将弦乐和打击乐初步分离后,对打击乐中残留的弦乐部分进行后处理,最后再变换回时域信号。采用音频信号客观评价(Perceptual Evaluation of Audio Quality,PEAQ)算法对分离后的音乐进行评估,结果表明该方法能有效地分离出打击乐和弦乐,同时无需数据驱动类分离方法中大量训练样本的支撑。 展开更多
关键词 弦乐 打击乐 音乐分离 倒谱
下载PDF
基于声音特征的隧道衬砌空洞识别方法研究
6
作者 代晓景 暴学志 +2 位作者 柴雪松 周城光 阎兆立 《声学技术》 CSCD 北大核心 2024年第1期135-141,共7页
目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过... 目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过提取隧道衬砌冲击回波的梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)作为特征,针对敲击回声脉冲信号长度不一的特点,提出了变帧长MFCC优化算法,并面向小样本条件,建立了支持向量机(Support Vector Machine,SVM)的识别模型。试验结果表明,该模型对衬砌空洞识别准确率可达89.9%。 展开更多
关键词 隧道衬砌空洞 声学信号处理 梅尔倒谱系数(MFCC) 支持向量机(SVM)
下载PDF
倒频谱法在斜拉桥索力分析中的应用研究
7
作者 贺博宙 邹兰林 《机械设计与制造》 北大核心 2024年第3期6-10,共5页
斜拉桥索力检测作为特大桥梁常规检测项目,应用非常广泛与频繁。现有常用检测方法为频率法,进行斜拉桥的索力检测过程中,经常会因拉索基频与塔台基频耦合,导致采集信号不理想,因而准确度较低,无法精准计算斜拉桥拉索索力。国外对于采样... 斜拉桥索力检测作为特大桥梁常规检测项目,应用非常广泛与频繁。现有常用检测方法为频率法,进行斜拉桥的索力检测过程中,经常会因拉索基频与塔台基频耦合,导致采集信号不理想,因而准确度较低,无法精准计算斜拉桥拉索索力。国外对于采样不理想的拉索进行分析时,通常利用多次采样或人工振动的方法来获取周期性更好的图像,操作繁琐并且精确度低,应用价值不高。因此,本研究针对采样信号不理想的问题采用倒频谱分析法对采集信号进行后处理。将复杂频谱图中的边频带转换为单条曲线,成功分离不同频率耦合的信号。通过对武汉二七长江大桥的实例分析验证,该索力检测法检验精度满足实际工程应用条件,且方法简便快捷,具有较高的实际应用价值。 展开更多
关键词 斜拉桥 索力检测 倒频谱 信号处理 MATLAB
下载PDF
基于双微麦克风阵列与WideResNet网络的语音命令词识别
8
作者 祁潇潇 曾庆宁 赵学军 《计算机应用与软件》 北大核心 2024年第5期126-130,共5页
为了提高噪声环境下语音识别的稳健性[1],提出宽残差深度神经网络的语音识别算法。该算法结合双微麦克风阵列系统、语音数据集为双微麦克风数据集,使用功率归一化倒谱系数作为特征参数输入到残差网络中进行训练。实验表明,与ResNet15模... 为了提高噪声环境下语音识别的稳健性[1],提出宽残差深度神经网络的语音识别算法。该算法结合双微麦克风阵列系统、语音数据集为双微麦克风数据集,使用功率归一化倒谱系数作为特征参数输入到残差网络中进行训练。实验表明,与ResNet15模型、ResNet18模型相比,只有三个残差模块的宽残差网络在噪声环境下语音命令词的识别和内外部说话人检测任务中具有较高的准确度,均达到了95%以上。 展开更多
关键词 语音识别 宽残差神经网络 功率归一化倒谱系数 双微麦克风阵列
下载PDF
基于MFCC和随机森林的GIS动作声纹特征辨识和操作机构异常分类
9
作者 庄小亮 李乾坤 +3 位作者 秦秉东 张长虹 张柳健 张禄亮 《电机与控制应用》 2024年第3期10-20,共11页
针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用M... 针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用MFCC提取声纹信号的特征;然后,构建随机森林对提取的特征信息进行辨识,得到GIS动作异常的分类结果;最后,以某110 kV的GIS设备为例,采集断路器、隔离开关的储能机构和传动机构异常或故障时的声纹信号,构建了音频样本库,并对所提分类模型与多种经典模型进行了对比测试。结果表明,MFCC能够有效提取出不同工况下GIS动作的声纹信号特征,且随机森林在众多分类识别模型中表现最优,有效提高了GIS动作异常工况识别的准确率。 展开更多
关键词 GIS动作异常 操作机构 声纹特征辨识 梅尔倒谱系数 随机森林
下载PDF
基于均值量的多媒体数字音频内嵌水印算法
10
作者 周瑞乾 王皓 《计算机仿真》 2024年第7期290-294,共5页
与图片或视频相比,音频是在时间域上连续变化的信号,具有更高的维度和复杂性,且需要应对各种攻击手段,为了有效提升多媒体数字音频水印的安全性,提出一种基于倒谱变换的多媒体数字音频水印算法。通过改进小波域阈值滤波算法对多媒体数... 与图片或视频相比,音频是在时间域上连续变化的信号,具有更高的维度和复杂性,且需要应对各种攻击手段,为了有效提升多媒体数字音频水印的安全性,提出一种基于倒谱变换的多媒体数字音频水印算法。通过改进小波域阈值滤波算法对多媒体数字音频信号展开分解处理,经过分解处理后,对选定的音频段展开倒谱变换,获取各段音频信号对应的倒谱系数,经过计算获取倒谱系数均值,并对倒谱系数均值量化处理,最后通过修改后的倒谱系数在多媒体数字音频内嵌入水印。通过大量实验分析证明,所提方法可以承受不同类型的攻击,有效确保多媒体数字音频的安全性。 展开更多
关键词 倒谱变换 多媒体数字音频 改进小波域阈值滤波算法 倒谱系数
下载PDF
基于特征融合与注意力机制的鸟类声纹识别方法
11
作者 潘齐炜 程吉祥 +2 位作者 田甜 吴丹 曾蕊 《声学技术》 CSCD 北大核心 2024年第5期686-695,共10页
鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方... 鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方法。首先,在特征提取时分别获取梅尔频率倒谱系数和功率正则化倒谱系数,其次利用均值和方差归一化处理将两种特征融合得到新型融合特征参数MPFC;然后,以ResNet-50为主干网络在其残差模块中引入轻量化坐标注意力机制得到改进网络模型—坐标注意力残差网络;最后,将融合特征分别输入到坐标注意力残差网络(residual coordinate attention net, ResCA),ResNet-50、ResNeSt-50、DenseNet-121和EfficientNet-B0并在两个数据集Birdsdata和BirdCLEF上进行对比实验。实验结果表明,融合特征比单一特征有更好的表征能力,能够提高一定识别率,改进网络也具有较好的识别效果。 展开更多
关键词 鸟类声纹识别 特征融合 梅尔频率倒谱系数 功率正则化倒谱系
下载PDF
基于改进MFCC算法的风力机叶片故障诊断方法
12
作者 张家安 田家辉 +2 位作者 王铁成 邓强 梁涛 《太阳能学报》 EI CAS CSCD 北大核心 2024年第1期285-290,共6页
针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率... 针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率特性,明确叶片声音信号的频率分布区域,将全频段分为三部分;然后采用粒子群优化算法(PSO)对梅尔(Mel)函数在不同频段上的敏感度进行优化,在迭代过程中将MFCC算法提取的叶片声音特征进行聚类,以轮廓系数作为适应度函数;最后基于支持向量机(SVM)构建分类器,实现风力机叶片故障的准确识别。以华北某风电场的叶片声音采集数据为算例,考察该算法在不同风速工况下的适应性,验证该方法的有效性。 展开更多
关键词 风力机叶片 声信号处理 故障诊断 特征提取 梅尔频率倒谱系数
下载PDF
基于MFCC的碳纤维复合缠绕气瓶损伤声发射信号分析
13
作者 魏莱 龙飞飞 +1 位作者 杨可鑫 李沛莹 《无损检测》 CAS 2024年第4期53-58,共6页
针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势... 针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势进行同步比较。试验结果表明,不同损伤类型梅尔倒谱系数的分布呈现出明显的规律性。该研究结果可为CFPR材料的声发射检测信号识别提供一些参考。 展开更多
关键词 碳纤维复合缠绕气瓶 声发射 冲击 梅尔频率倒谱系数
下载PDF
倒频谱分析在滚动轴承故障诊断中的应用研究
14
作者 张斌 《机械工程与自动化》 2024年第1期144-145,148,共3页
利用倒频谱分析对边频成分具有“概况”的能力,能方便提取、分析原频谱图上肉眼难以识别的周期信号,研究了倒频谱分析在滚动轴承故障诊断中的应用。对两组不同的滚动轴承内圈故障实验信号进行了分析,结果表明:若要利用倒频谱分析对滚动... 利用倒频谱分析对边频成分具有“概况”的能力,能方便提取、分析原频谱图上肉眼难以识别的周期信号,研究了倒频谱分析在滚动轴承故障诊断中的应用。对两组不同的滚动轴承内圈故障实验信号进行了分析,结果表明:若要利用倒频谱分析对滚动轴承进行有效的故障诊断,需要在信号采集时或者信号处理时降低背景噪声中较低频率的振动对采集信号的影响。 展开更多
关键词 滚动轴承 故障诊断 倒频谱
下载PDF
基于人工智能技术的乐曲节拍识别系统设计
15
作者 杨刘园 《自动化技术与应用》 2024年第3期128-131,共4页
为了高精度识别乐曲节拍,设计基于人工智能技术的乐曲节拍识别系统。首先采集乐曲节拍音频信号,对信号实施放大处理,然后采用复倒谱与子串匹配提取音频信号指纹特征,与乐曲数据库指纹进行匹配,根据匹配结果进行乐曲节拍识别,最后测试所... 为了高精度识别乐曲节拍,设计基于人工智能技术的乐曲节拍识别系统。首先采集乐曲节拍音频信号,对信号实施放大处理,然后采用复倒谱与子串匹配提取音频信号指纹特征,与乐曲数据库指纹进行匹配,根据匹配结果进行乐曲节拍识别,最后测试所设计系统应用性能。测试结果显示:所设计系统可以高精度识别多种乐曲节拍中有效音频信号,漏识率低,具有较高的实际应用价值。 展开更多
关键词 人工智能 音频指纹技术 乐曲节拍 识别系统 复倒谱 子串匹配
下载PDF
基于音频特征的水车室工作状态异常检测
16
作者 曾广栋 魏学锋 +2 位作者 何林 孙长江 张旋 《水电能源科学》 北大核心 2024年第8期168-172,共5页
水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采... 水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采用STFT、Log-Mel、MFCC等方法对音频数据进行了预处理,建立了基于音频数据的异常检测模型,并对溪洛渡水电站水车室工作状态进行了异常检测。结果表明,Log-Mel方法具有有效性。研究结果不仅降低了异常检测的成本,还为水电机组的健康监测提供了参考。 展开更多
关键词 音频数据 水车室 STFT Log-Mel 梅尔频率倒频谱系数(MFCC) 时域特征 支持向量机
下载PDF
基于基音频率的数字化音乐情感分类方法
17
作者 刘鹏 《自动化技术与应用》 2024年第7期158-162,共5页
为提升音乐分类准确率,提出基于基音频率的数字化音乐情感分类方法。其中通过添加滤波器对音乐信号进行预加重,引入帧移实施分帧处理,使用截断函数实施截断处理。基于多项式拟合设计AMDF基音频率检测算法,对预处理后的音乐信号进行数字... 为提升音乐分类准确率,提出基于基音频率的数字化音乐情感分类方法。其中通过添加滤波器对音乐信号进行预加重,引入帧移实施分帧处理,使用截断函数实施截断处理。基于多项式拟合设计AMDF基音频率检测算法,对预处理后的音乐信号进行数字化分析。提取Mel频率倒谱系数、线性预测倒谱系数、共振峰参数等特征参数。基于CNN-LSTM构建音乐情感分类模型,完成数字化音乐情感分类。实验结果表明,该方法在不同情感类别与不同帧移大小下,分类准确率均较高,误报率均较低,性能较好。 展开更多
关键词 特征提取 基音频率 滤波器 数字化音乐 MEL频率倒谱系数 情感分类
下载PDF
基于特征选择的方言辨别模型
18
作者 艾虎 李菲 《信息技术》 2024年第10期102-110,119,共10页
为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与... 为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与其他先进的特征选择方法进行比较,最后对随机森林分类模型进行改进。结果显示,该方法从39个特征变量中选取了8个最相关的梅尔频率倒谱系数(MFCC),显著优于与之比较的特征选择方法。经过改进的随机森林模型分类精确度为96.64%。该研究采用的特征选择算法和改进的随机森林模型,让方言辨别模型的性能得到显著提升。 展开更多
关键词 汉语方言辨识 梅尔频率倒谱系数 特征选择 随机森林 向后消除法
下载PDF
基于倒频谱技术的滚动轴承故障诊断应用研究
19
作者 唐卫辉 《价值工程》 2024年第23期108-111,共4页
滚动轴承广泛应用在风电装备领域,当滚动轴承出现故障时,实际采集的振动信号是复杂的非平稳信号,传统的傅里叶变换在提取谐波、边频带等周期成分时显的力不从心,不能有效检测微弱的周期激励信号。本文提出一种倒频谱分析技术,能对周期... 滚动轴承广泛应用在风电装备领域,当滚动轴承出现故障时,实际采集的振动信号是复杂的非平稳信号,传统的傅里叶变换在提取谐波、边频带等周期成分时显的力不从心,不能有效检测微弱的周期激励信号。本文提出一种倒频谱分析技术,能对周期性异常振动信号进行分离,通过对轴承内圈损伤的诊断,结果表明,倒频谱分析技术能对风电装备滚动轴承的复杂的振动信号进行诊断并准确定位,在检测故障信号周期成分方面有显著优势。 展开更多
关键词 倒频谱 功率谱 滚动轴承 故障诊断
下载PDF
基于PANNs-CNN的环境声音分类算法研究及应用
20
作者 关志广 《无线互联科技》 2024年第16期12-15,共4页
环境声音分类(ESC)技术主要涉及声音特征提取和分类器算法的选择。为了探索最佳的特征提取方法和分类器组合,文章对深度学习模型PANNs-CNN进行了研究和分析,对不同的特征提取方法进行了实验对比。实验结果表明,在与同类模型对比中,选用... 环境声音分类(ESC)技术主要涉及声音特征提取和分类器算法的选择。为了探索最佳的特征提取方法和分类器组合,文章对深度学习模型PANNs-CNN进行了研究和分析,对不同的特征提取方法进行了实验对比。实验结果表明,在与同类模型对比中,选用预训练且更深层的CNN模型可以提高ESC的预测性能;Log-Mel特征可以更好地保留声音信号高维度特征及特征相关性,有助于提升模型分类准确率。文章研究的基于Log-Mel特征提取方式和PANNs-CNN 14的环境声音分类算法在ESC-50数据集上的分类准确率最好,并且在实际应用中验证了该算法的有效性。 展开更多
关键词 环境声音分类 预训练音频神经网络 卷积神经网络 Log-Mel MEL频率倒谱系数
下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部