期刊文献+
共找到300篇文章
< 1 2 15 >
每页显示 20 50 100
基于特征融合和B-SVM的鸟鸣声识别算法 被引量:1
1
作者 陈晓 曾昭优 《声学技术》 CSCD 北大核心 2024年第1期119-126,共8页
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。... 为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。 展开更多
关键词 鸟鸣声识别 梅尔频率倒谱系数 线性判别算法 黑寡妇优化算法 支持向量机
下载PDF
基于MFCC和GMM的瓷砖空鼓率识别系统及方法
2
作者 周浩 梁军汀 卢杰 《无损检测》 CAS 2024年第3期28-32,55,共6页
针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试... 针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试验结果表明,采用MFCC和GMM相结合的方法,可以对瓷砖空鼓情况进行有效识别,该方法具有良好的应用前景。 展开更多
关键词 声纹识别 梅尔倒谱系数 混合高斯模型
下载PDF
梅尔频率倒谱系数在声带息肉手术前后嗓音分析中的价值研究
3
作者 刘茉 葛鑫颖 +2 位作者 赵晓畅 郝青青 李祖飞 《中国耳鼻咽喉颅底外科杂志》 CAS CSCD 2024年第2期102-105,共4页
目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年... 目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年龄(42.9±11.4)岁。另选取无声嘶且无声带病变的正常受试者21例作为基线对照。使用基于Python编程语言的librosa语音处理包进行MFCC特征提取,分别提取每位患者的MFCC均值,MFCC方差与MFCC标准差,使用配对样本t检验比较声带息肉手术前后上述各MFCC特征的差异。结果 声带息肉患者术后MFCC均值1.25±1.01、MFCC方差561.34±154.98及MFCC标准差21.74±4.03比术前MFCC均值6.81±2.05、MFCC方差1 019.66±295.87及MFCC标准差34.37±6.63显著下降,差异具有统计学意义(t=18.596,P=0.000;t=10.338,P=0.000;t=11.852,P=0.000)。声带息肉组患者术后1个月其MFCC均值、MFCC方差及MFCC标准差与正常受试者相比差异均无统计学意义,表明绝大部分声带息肉患者术后嗓音得到良好的恢复。结论 本研究首次探索了MFCC在声带息肉手术前后嗓音分析中的价值,MFCC各特征可作为评估声带息肉术后嗓音恢复的指标。 展开更多
关键词 声带息肉 声嘶 梅尔频率倒谱系数 嗓音分析 手术
下载PDF
基于声音特征的隧道衬砌空洞识别方法研究
4
作者 代晓景 暴学志 +2 位作者 柴雪松 周城光 阎兆立 《声学技术》 CSCD 北大核心 2024年第1期135-141,共7页
目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过... 目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过提取隧道衬砌冲击回波的梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)作为特征,针对敲击回声脉冲信号长度不一的特点,提出了变帧长MFCC优化算法,并面向小样本条件,建立了支持向量机(Support Vector Machine,SVM)的识别模型。试验结果表明,该模型对衬砌空洞识别准确率可达89.9%。 展开更多
关键词 隧道衬砌空洞 声学信号处理 梅尔倒谱系数(MFCC) 支持向量机(SVM)
下载PDF
基于双微麦克风阵列与WideResNet网络的语音命令词识别
5
作者 祁潇潇 曾庆宁 赵学军 《计算机应用与软件》 北大核心 2024年第5期126-130,共5页
为了提高噪声环境下语音识别的稳健性[1],提出宽残差深度神经网络的语音识别算法。该算法结合双微麦克风阵列系统、语音数据集为双微麦克风数据集,使用功率归一化倒谱系数作为特征参数输入到残差网络中进行训练。实验表明,与ResNet15模... 为了提高噪声环境下语音识别的稳健性[1],提出宽残差深度神经网络的语音识别算法。该算法结合双微麦克风阵列系统、语音数据集为双微麦克风数据集,使用功率归一化倒谱系数作为特征参数输入到残差网络中进行训练。实验表明,与ResNet15模型、ResNet18模型相比,只有三个残差模块的宽残差网络在噪声环境下语音命令词的识别和内外部说话人检测任务中具有较高的准确度,均达到了95%以上。 展开更多
关键词 语音识别 宽残差神经网络 功率归一化倒谱系数 双微麦克风阵列
下载PDF
基于MFCC和随机森林的GIS动作声纹特征辨识和操作机构异常分类
6
作者 庄小亮 李乾坤 +3 位作者 秦秉东 张长虹 张柳健 张禄亮 《电机与控制应用》 2024年第3期10-20,共11页
针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用M... 针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用MFCC提取声纹信号的特征;然后,构建随机森林对提取的特征信息进行辨识,得到GIS动作异常的分类结果;最后,以某110 kV的GIS设备为例,采集断路器、隔离开关的储能机构和传动机构异常或故障时的声纹信号,构建了音频样本库,并对所提分类模型与多种经典模型进行了对比测试。结果表明,MFCC能够有效提取出不同工况下GIS动作的声纹信号特征,且随机森林在众多分类识别模型中表现最优,有效提高了GIS动作异常工况识别的准确率。 展开更多
关键词 GIS动作异常 操作机构 声纹特征辨识 梅尔倒谱系数 随机森林
下载PDF
基于特征融合与注意力机制的鸟类声纹识别方法
7
作者 潘齐炜 程吉祥 +2 位作者 田甜 吴丹 曾蕊 《声学技术》 CSCD 北大核心 2024年第5期686-695,共10页
鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方... 鸟类声纹识别技术是一种将经过预处理的多种鸟类声音作为输入,通过网络模型识别出相应鸟类的技术。针对真实环境下鸟类声纹识别中单一音频特征局限和模型学习特征能力不佳问题,文章提出了一种基于特征融合和注意力机制的鸟类声纹识别方法。首先,在特征提取时分别获取梅尔频率倒谱系数和功率正则化倒谱系数,其次利用均值和方差归一化处理将两种特征融合得到新型融合特征参数MPFC;然后,以ResNet-50为主干网络在其残差模块中引入轻量化坐标注意力机制得到改进网络模型—坐标注意力残差网络;最后,将融合特征分别输入到坐标注意力残差网络(residual coordinate attention net, ResCA),ResNet-50、ResNeSt-50、DenseNet-121和EfficientNet-B0并在两个数据集Birdsdata和BirdCLEF上进行对比实验。实验结果表明,融合特征比单一特征有更好的表征能力,能够提高一定识别率,改进网络也具有较好的识别效果。 展开更多
关键词 鸟类声纹识别 特征融合 梅尔频率倒谱系数 功率正则化倒谱系
下载PDF
基于改进MFCC算法的风力机叶片故障诊断方法
8
作者 张家安 田家辉 +2 位作者 王铁成 邓强 梁涛 《太阳能学报》 EI CAS CSCD 北大核心 2024年第1期285-290,共6页
针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率... 针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率特性,明确叶片声音信号的频率分布区域,将全频段分为三部分;然后采用粒子群优化算法(PSO)对梅尔(Mel)函数在不同频段上的敏感度进行优化,在迭代过程中将MFCC算法提取的叶片声音特征进行聚类,以轮廓系数作为适应度函数;最后基于支持向量机(SVM)构建分类器,实现风力机叶片故障的准确识别。以华北某风电场的叶片声音采集数据为算例,考察该算法在不同风速工况下的适应性,验证该方法的有效性。 展开更多
关键词 风力机叶片 声信号处理 故障诊断 特征提取 梅尔频率倒谱系数
下载PDF
基于均值量的多媒体数字音频内嵌水印算法
9
作者 周瑞乾 王皓 《计算机仿真》 2024年第7期290-294,共5页
与图片或视频相比,音频是在时间域上连续变化的信号,具有更高的维度和复杂性,且需要应对各种攻击手段,为了有效提升多媒体数字音频水印的安全性,提出一种基于倒谱变换的多媒体数字音频水印算法。通过改进小波域阈值滤波算法对多媒体数... 与图片或视频相比,音频是在时间域上连续变化的信号,具有更高的维度和复杂性,且需要应对各种攻击手段,为了有效提升多媒体数字音频水印的安全性,提出一种基于倒谱变换的多媒体数字音频水印算法。通过改进小波域阈值滤波算法对多媒体数字音频信号展开分解处理,经过分解处理后,对选定的音频段展开倒谱变换,获取各段音频信号对应的倒谱系数,经过计算获取倒谱系数均值,并对倒谱系数均值量化处理,最后通过修改后的倒谱系数在多媒体数字音频内嵌入水印。通过大量实验分析证明,所提方法可以承受不同类型的攻击,有效确保多媒体数字音频的安全性。 展开更多
关键词 倒谱变换 多媒体数字音频 改进小波域阈值滤波算法 倒谱系数
下载PDF
基于MFCC的碳纤维复合缠绕气瓶损伤声发射信号分析
10
作者 魏莱 龙飞飞 +1 位作者 杨可鑫 李沛莹 《无损检测》 CAS 2024年第4期53-58,共6页
针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势... 针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势进行同步比较。试验结果表明,不同损伤类型梅尔倒谱系数的分布呈现出明显的规律性。该研究结果可为CFPR材料的声发射检测信号识别提供一些参考。 展开更多
关键词 碳纤维复合缠绕气瓶 声发射 冲击 梅尔频率倒谱系数
下载PDF
基于音频特征的水车室工作状态异常检测
11
作者 曾广栋 魏学锋 +2 位作者 何林 孙长江 张旋 《水电能源科学》 北大核心 2024年第8期168-172,共5页
水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采... 水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采用STFT、Log-Mel、MFCC等方法对音频数据进行了预处理,建立了基于音频数据的异常检测模型,并对溪洛渡水电站水车室工作状态进行了异常检测。结果表明,Log-Mel方法具有有效性。研究结果不仅降低了异常检测的成本,还为水电机组的健康监测提供了参考。 展开更多
关键词 音频数据 水车室 STFT Log-Mel 梅尔频率倒频谱系数(MFCC) 时域特征 支持向量机
下载PDF
基于基音频率的数字化音乐情感分类方法
12
作者 刘鹏 《自动化技术与应用》 2024年第7期158-162,共5页
为提升音乐分类准确率,提出基于基音频率的数字化音乐情感分类方法。其中通过添加滤波器对音乐信号进行预加重,引入帧移实施分帧处理,使用截断函数实施截断处理。基于多项式拟合设计AMDF基音频率检测算法,对预处理后的音乐信号进行数字... 为提升音乐分类准确率,提出基于基音频率的数字化音乐情感分类方法。其中通过添加滤波器对音乐信号进行预加重,引入帧移实施分帧处理,使用截断函数实施截断处理。基于多项式拟合设计AMDF基音频率检测算法,对预处理后的音乐信号进行数字化分析。提取Mel频率倒谱系数、线性预测倒谱系数、共振峰参数等特征参数。基于CNN-LSTM构建音乐情感分类模型,完成数字化音乐情感分类。实验结果表明,该方法在不同情感类别与不同帧移大小下,分类准确率均较高,误报率均较低,性能较好。 展开更多
关键词 特征提取 基音频率 滤波器 数字化音乐 MEL频率倒谱系数 情感分类
下载PDF
基于特征选择的方言辨别模型
13
作者 艾虎 李菲 《信息技术》 2024年第10期102-110,119,共10页
为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与... 为了从语音样本中选择数量最少的相关特征变量,并让基于随机森林(RF)的贵州汉语方言辨别模型达到所需的精度。该研究采用基于随机森林的差异排序向后消除法(SDBE),利用Python 3.6,对贵州3个市县群的汉语方言语音样本进行特征选择,并与其他先进的特征选择方法进行比较,最后对随机森林分类模型进行改进。结果显示,该方法从39个特征变量中选取了8个最相关的梅尔频率倒谱系数(MFCC),显著优于与之比较的特征选择方法。经过改进的随机森林模型分类精确度为96.64%。该研究采用的特征选择算法和改进的随机森林模型,让方言辨别模型的性能得到显著提升。 展开更多
关键词 汉语方言辨识 梅尔频率倒谱系数 特征选择 随机森林 向后消除法
下载PDF
基于PANNs-CNN的环境声音分类算法研究及应用
14
作者 关志广 《无线互联科技》 2024年第16期12-15,共4页
环境声音分类(ESC)技术主要涉及声音特征提取和分类器算法的选择。为了探索最佳的特征提取方法和分类器组合,文章对深度学习模型PANNs-CNN进行了研究和分析,对不同的特征提取方法进行了实验对比。实验结果表明,在与同类模型对比中,选用... 环境声音分类(ESC)技术主要涉及声音特征提取和分类器算法的选择。为了探索最佳的特征提取方法和分类器组合,文章对深度学习模型PANNs-CNN进行了研究和分析,对不同的特征提取方法进行了实验对比。实验结果表明,在与同类模型对比中,选用预训练且更深层的CNN模型可以提高ESC的预测性能;Log-Mel特征可以更好地保留声音信号高维度特征及特征相关性,有助于提升模型分类准确率。文章研究的基于Log-Mel特征提取方式和PANNs-CNN 14的环境声音分类算法在ESC-50数据集上的分类准确率最好,并且在实际应用中验证了该算法的有效性。 展开更多
关键词 环境声音分类 预训练音频神经网络 卷积神经网络 Log-Mel MEL频率倒谱系数
下载PDF
基于VMD和CNN-BiLSTM的矿井提升电动机故障诊断方法 被引量:1
15
作者 李敬兆 何娜 +2 位作者 张金伟 王擎 李化顺 《工矿自动化》 CSCD 北大核心 2023年第7期49-59,共11页
针对传统基于音频信号的电动机故障诊断方法获取电动机音频信号特征信息不足和故障诊断精度不高的问题,提出了一种基于优化的变分模态分解(VMD)和卷积神经网络CNN-双向长短期记忆(BiLSTM)的矿井提升电动机故障诊断方法。针对模态混叠和... 针对传统基于音频信号的电动机故障诊断方法获取电动机音频信号特征信息不足和故障诊断精度不高的问题,提出了一种基于优化的变分模态分解(VMD)和卷积神经网络CNN-双向长短期记忆(BiLSTM)的矿井提升电动机故障诊断方法。针对模态混叠和端点效应问题,采用鲸鱼算法(WOA)优化的VMD对电动机音频信号进行分解,将电动机音频信号分解为K个本征模态分量(IMF),经Pearson相关系数筛选后,提取主IMF分量的13维静态MFCC特征参数,为了获取信号的动态特征,提取13维静态MFCC的一阶差分和二阶差分系数,构成39维特征向量,从而把动静态特征结合起来,提高故障诊断性能。为了提高故障诊断精度,在CNN中引入BiLSTM层,CNN在空间维度上提取音频信号的局部特征,BiLSTM在时间维度上保留音频信号的双向时间序列信息,捕获音频信号长距离依赖关系,从而最大程度保留全局和局部特征。实验结果表明:①VMD分解的每个IMF分量都具有独立的中心频率且分布均匀,在频域上表现出稀疏性的特点,能够有效避免模态混叠问题;在IMF求解中,VMD分解通过镜像延拓的方式避免了经验模态分解(EMD)和集合经验模态分解(EEMD)中出现的端点效应问题。②基于13维静态MFCC特征的故障诊断准确率为97.5%,基于39维动静态MFCC特征的故障诊断准确率比基于13维静态MFCC特征的故障诊断准确率提高了1.11%。③基于CNN-BiLSTM诊断模型的准确率达到98.61%,与目前通用诊断模型CNN,BiLSTM和CNN-LSTM相比,准确率分别提高5.83%,4.17%和3.89%。 展开更多
关键词 矿井提升电动机故障诊断 音频信号 变分模态分解 梅尔倒谱系数 CNN-BiLSTM
下载PDF
基于声振特征区分的SMA优化SVM变压器机械松动识别方法 被引量:1
16
作者 马宏忠 王健 +1 位作者 杨启帆 倪一铭 《电机与控制学报》 EI CSCD 北大核心 2023年第10期42-53,共12页
基于梅尔频率倒谱系数(MFCC)提取的声振特征无法清晰描述变压器信号本身能量分布,应用于变压器机械松动识别时存在准确率不高的局限性,因此提出一种优先进行声振特征区分的变压器故障识别方法。首先依据XGBoost贡献指标化结合粗糙集分... 基于梅尔频率倒谱系数(MFCC)提取的声振特征无法清晰描述变压器信号本身能量分布,应用于变压器机械松动识别时存在准确率不高的局限性,因此提出一种优先进行声振特征区分的变压器故障识别方法。首先依据XGBoost贡献指标化结合粗糙集分析区分MFCC特征显隐性:显性特征对状态识别贡献更高;其次,建立以Focal损失为目标的SMA优化模型,并按显隐性为SVM输入设置权重范围;最后,利用优化后的SVM对变压器实测样本进行训练分析。结果表明,该识别方法平均准确率达98.83%,较仅参数优化SVM的识别准确率提高2.48%,且变异波动小。相比PSO、WOA和GOA算法,SMA算法在特征全局优化和损失收敛性上更突出。此外,该方法还具有一定鲁棒性,引入5%干扰样本后准确率下降在0.3%以内,从而在变压器实际运行环境中具有抗干扰价值。 展开更多
关键词 梅尔频率倒谱系数 分布式梯度增强 贡献指标化 黏菌算法 支持向量机 变压器状态识别
下载PDF
基于机器学习的膝关节损伤检测方法
17
作者 朱俊 《安徽水利水电职业技术学院学报》 2023年第4期31-34,68,共5页
文章提出了一种基于机器学习的膝关节损伤检测方法。该方法利用加速度计采集的膝关节摆动信号,首先通过小波变换降低信号中的噪声能量,从而提高信噪比。接着,利用小波包分解提取小波能量,并通过梅林滤波器组计算信号的梅林倒谱系数。随... 文章提出了一种基于机器学习的膝关节损伤检测方法。该方法利用加速度计采集的膝关节摆动信号,首先通过小波变换降低信号中的噪声能量,从而提高信噪比。接着,利用小波包分解提取小波能量,并通过梅林滤波器组计算信号的梅林倒谱系数。随后,将小波能量与梅林倒谱系数融合,形成融合特征,并通过主成分分析去除冗余信息。最后,采用最小二乘支持向量机、径向基神经网络和贝叶斯网络对健康和受损的膝关节摆动信号进行分类。实验结果表明,与现有方法相比,该方法在膝关节损伤检测方面具有更高的准确率。 展开更多
关键词 损伤检测 小波包分解 梅林倒谱系数 主成分分析 神经网络
下载PDF
基于卷积神经网络的火车站语音情感识别方法 被引量:2
18
作者 彭凯贝 孙小明 +1 位作者 陈皓炜 王建荣 《计算机仿真》 北大核心 2023年第2期177-180,189,共5页
近年来,卷积神经网络在图像、文本、语音分类等领域广泛使用,但现有的研究大多忽视了特定场所下语音情感识别的性能。针对上述问题,提出一种基于卷积神经网络(CNN)的火车站语音情感识别模型。模型首先提取每条语音的梅尔倒谱系数(MFCC)... 近年来,卷积神经网络在图像、文本、语音分类等领域广泛使用,但现有的研究大多忽视了特定场所下语音情感识别的性能。针对上述问题,提出一种基于卷积神经网络(CNN)的火车站语音情感识别模型。模型首先提取每条语音的梅尔倒谱系数(MFCC)特征,然后把提取的特征矩阵送到卷积神经网络训练,最后由网络输出每个语音的所属类别。此外在模型的输出层加入了置信度的设置,认为每一条语音属于某类别的概率大于90%则是可信的,否则不可信。实验结果表明,与循环神经网络(RNN)和多层感知器(MLP)相比,上述模型准确率更高。所提出的方法为深度学习技术在语音情感识别中的应用及火车站等场所危险情况的预警提供了一定的借鉴。 展开更多
关键词 深度学习 语音情感识别 卷积神经网络 梅尔频率倒谱系数
下载PDF
Mel频率倒谱系数平滑的耳机均衡
19
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函数 MEL频率倒谱系数 平滑 均衡 耳机声重放
下载PDF
基于梅尔倒谱系数的微细铣削颤振监测研究
20
作者 宋吉超 赵国龙 +2 位作者 李亮 年智文 何宁 《工具技术》 北大核心 2023年第12期135-139,共5页
微细铣削过程中的颤振是一种加工不稳定现象,会导致加工表面恶化、刀具快速磨损甚至刀具破损。本文提出了一种基于梅尔倒谱系数—隐马尔可夫模型改进的声音信号机器学习模型,更适用于加工过程的状态识别。开展Ti-6Al-4V钛合金微细铣削... 微细铣削过程中的颤振是一种加工不稳定现象,会导致加工表面恶化、刀具快速磨损甚至刀具破损。本文提出了一种基于梅尔倒谱系数—隐马尔可夫模型改进的声音信号机器学习模型,更适用于加工过程的状态识别。开展Ti-6Al-4V钛合金微细铣削在不同加工状态下的声音信号采集试验,用于训练机器学习模型并获得模式库。通过对铣削过程中的不同声音信号与模式库进行比较,验证了所提出的机器学习模型的准确性。研究表明,基于合理的特征选取和模型参数优化,所提出的机器学习模型对加工状态的识别准确率达到82%。本研究可为改进微细铣削过程中的在线监测技术提供指导。 展开更多
关键词 颤振预测 微细铣削 状态识别 梅尔倒谱系数 隐马尔科夫链
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部