期刊文献+
共找到415篇文章
< 1 2 21 >
每页显示 20 50 100
梅尔频率倒谱系数在声带息肉手术前后嗓音分析中的价值研究
1
作者 刘茉 葛鑫颖 +2 位作者 赵晓畅 郝青青 李祖飞 《中国耳鼻咽喉颅底外科杂志》 CAS CSCD 2024年第2期102-105,共4页
目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年... 目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年龄(42.9±11.4)岁。另选取无声嘶且无声带病变的正常受试者21例作为基线对照。使用基于Python编程语言的librosa语音处理包进行MFCC特征提取,分别提取每位患者的MFCC均值,MFCC方差与MFCC标准差,使用配对样本t检验比较声带息肉手术前后上述各MFCC特征的差异。结果 声带息肉患者术后MFCC均值1.25±1.01、MFCC方差561.34±154.98及MFCC标准差21.74±4.03比术前MFCC均值6.81±2.05、MFCC方差1 019.66±295.87及MFCC标准差34.37±6.63显著下降,差异具有统计学意义(t=18.596,P=0.000;t=10.338,P=0.000;t=11.852,P=0.000)。声带息肉组患者术后1个月其MFCC均值、MFCC方差及MFCC标准差与正常受试者相比差异均无统计学意义,表明绝大部分声带息肉患者术后嗓音得到良好的恢复。结论 本研究首次探索了MFCC在声带息肉手术前后嗓音分析中的价值,MFCC各特征可作为评估声带息肉术后嗓音恢复的指标。 展开更多
关键词 声带息肉 声嘶 梅尔频率谱系 嗓音分析 手术
下载PDF
基于脉搏波频域梅尔频率倒谱系数特征的高血压危险分层预测模型
2
作者 齐晨浩 杨晶东 +2 位作者 邱泽浩 尧明慧 燕海霞 《海军军医大学学报》 CAS CSCD 北大核心 2024年第10期1226-1240,共15页
目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transf... 目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transformer 结构提取脉搏波深层特征,并将自注意力机制与选择性内核注意力进行决策融合,提取脉搏波关联特征,并采用Floodings正则化方法间接控制训练损失,防止过拟合发生。针对上海中医药大学附属龙华医院及上海市中西医结合医院提供的527例临床脉诊数据,进行5折交叉验证实验。此外,采用梯度提升决策树算法统计脉搏波频域特征的贡献率排名,分析影响模型分类精度的关键因素,为中医临床辅助诊断提供参考价值。结果 本研究提出的模型分类评估指标准确度、F1值、精确率、召回率和AUC值分别为0.939 6、0.924 9、0.940 9、0.929 5和0.993 4。脉搏波的静态特征、一阶差分和二阶差分系数的贡献率相对均衡,说明高血压危险程度不仅与脉搏波的静态特征相关,也应当考虑脉搏波的动态特征。结论 与典型脉搏波分类模型相比,本研究提出的模型具有较高的分类精度和泛化性能。 展开更多
关键词 高血压 危险分层 梅尔频率谱系 时间卷积网络 TRANSFORMER
下载PDF
基于梅尔频率倒谱系数的语音清晰度DRT识别
3
作者 马成龙 焦俊清 +4 位作者 焦富清 王杰 陈巧特 谢武俊 李军 《信息化研究》 2024年第2期63-68,共6页
语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量... 语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量作为语音信号的特征参数,最后通过动态时间归整(DTW)进行相似度识别。实验表明,本文算法对汉语清晰度诊断押韵测试(DRT)字表的测试结果高达92.90%,有良好的识别率。 展开更多
关键词 语音清晰度 谱减法 端点检测 梅尔频率谱系 动态时间归整 汉语清晰度诊断押韵测试
下载PDF
Mel频率倒谱系数平滑的耳机均衡
4
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函 mel频率谱系 平滑 均衡 耳机声重放
下载PDF
说话人识别中的Mel特征频率倒谱系数 被引量:12
5
作者 曹辉 徐晨 +1 位作者 赵晓 吴胜举 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第2期203-208,共6页
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向... 目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。 展开更多
关键词 说话人识别 语音特征参 梅尔频率谱系 支持向量机 平均影响值
下载PDF
基于Mel频率倒谱系数和遗传算法的煤矸界面识别研究 被引量:6
6
作者 何爱香 王平建 +1 位作者 魏广芬 张守祥 《工矿自动化》 北大核心 2013年第2期66-71,共6页
针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放... 针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放落过程中产生的声波信号的特征差异进行煤矸识别,采用Mel频率倒谱系数将去噪后的煤矸声波信号变换到频域进行处理,提取出煤矸声波信号的32维特征参数;采用遗传算法优化处理32维特征参数,得到最优参数组合;采用支持向量机和BP神经网络对最优参数进行识别。实验结果表明,该方法能够准确识别出煤矸下落状态。 展开更多
关键词 放顶煤开采 煤矸界面识别 mel频率谱系 MFCC 遗传算法 支持向量机 BP神经网络
下载PDF
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:6
7
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 mel频率谱系 多窗频谱估计 滑动平均滤波 谱包络 说话人识别
下载PDF
基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取 被引量:2
8
作者 曾以成 陈雨莺 +1 位作者 毛燕湖 谢小娟 《湘潭大学自然科学学报》 CAS 北大核心 2015年第2期20-26,共7页
根据语音信号的非平稳特点,用经验模态分解方法把语音信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,得到新的语音,再对其进... 根据语音信号的非平稳特点,用经验模态分解方法把语音信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,得到新的语音,再对其进行后续处理.Wigner-Ville分布能精确地定位信号的时频结构,而传统傅氏变换不能反映信号的瞬时变化情况,但多分量信号的Wigner-Ville分布受困于交叉项的干扰,因此利用Wigner-Ville分布的优点,采用Wigner-Ville谱与傅氏谱结合来代替单独的傅氏谱作为每帧的特征,进行Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取.实验表明,经改进后的MFCC参数较传统的MFCC参数应用于说话人识别系统,识别率有较大提升,且鲁棒性较好. 展开更多
关键词 经验模态分解 Wigner-Ville谱 傅氏变换 mel频率谱系
下载PDF
差分和加权Mel倒谱混合参数应用于说话人识别 被引量:14
9
作者 柯晶晶 周萍 +1 位作者 景新幸 杨青 《微电子学与计算机》 CSCD 北大核心 2014年第9期88-91,共4页
说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权... 说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权特征参数与反映语音帧间变化的差分Mel频率倒谱系数进行维度筛选,再进行参数混合.实验结果表明,通过改进加权函数提取得到的特征参数与差分Mel频率倒谱系数的混合参数在矢量量化的说话人识别系统中,码本容量为16和32时可以达到100%的识别率. 展开更多
关键词 说话人识别 加权mel频率倒谱系数 混合参 矢量量化
下载PDF
一种具有鲁棒特性的Mel频率倒谱系数 被引量:1
10
作者 吴华玉 曾毓敏 李平 《金陵科技学院学报》 2008年第2期26-29,共4页
通过研究在低能量段用幂函数代替自然对数函数对Mel滤波器组的输出进行处理,从而得到一种改进Mel频率倒谱系数(PL-MFCC)。实验表明,这种参数能够提高含噪语音的说话人识别率。如果含噪语音通过wiener滤波增强算法消噪后,再用PL-MFCC来... 通过研究在低能量段用幂函数代替自然对数函数对Mel滤波器组的输出进行处理,从而得到一种改进Mel频率倒谱系数(PL-MFCC)。实验表明,这种参数能够提高含噪语音的说话人识别率。如果含噪语音通过wiener滤波增强算法消噪后,再用PL-MFCC来提取特征参数,能够进一步提高在噪声环境下说话人的识别率。 展开更多
关键词 说话人识别 mel频率谱系 语音增强 WIENER滤波
下载PDF
基于Mel倒谱系数和矢量量化的昆虫声音自动鉴别 被引量:9
11
作者 竺乐庆 王鸿斌 张真 《昆虫学报》 CAS CSCD 北大核心 2010年第8期901-907,共7页
为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音... 为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音信号经过预处理、分段得到一系列的声音样本,从声音样本提取Mel倒谱系数(MFCC),并用Linde-Buzo-Gray(LBG)算法对提取的MFCC进行矢量量化(VQ),所得码字作为声音样本的特征模型。特征参数之间的匹配用搜索最近邻的方法实现。本文方法在包含70种昆虫声音的库中进行了试验,取得了超过96%的识别率和理想的时间性能。试验结果证明了该方法的有效性。 展开更多
关键词 昆虫 声音识别 mel谱系 LBG算法 矢量量化
下载PDF
基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法 被引量:21
12
作者 胡峰松 张璇 《计算机应用》 CSCD 北大核心 2012年第9期2542-2544,共3页
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFC... 为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 展开更多
关键词 说话人识别 梅尔频率谱系 翻转梅尔频率谱系 FISHER准则 高斯混合模型
下载PDF
基于梅尔频率倒谱系数与动态时间规整的安卓声纹解锁系统 被引量:11
13
作者 陈锦飞 徐欣 《计算机工程》 CAS CSCD 北大核心 2017年第2期201-205,共5页
安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关... 安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关的声纹模式匹配,并结合安卓NDK技术实现快速声纹识别。实验结果表明,该系统具有较高的解锁成功率和较快的解锁速度,相比数字或图形解锁,声纹解锁安全性更高,用户体验更好。 展开更多
关键词 梅尔频率谱系 动态时间规整 声纹识别 安卓系统 声纹解锁
下载PDF
基于MEL频率倒谱系数技术的音控汽车天窗的研究设计
14
作者 袁霞 赵向阳 《河南机电高等专科学校学报》 CAS 2015年第2期13-14,82,共3页
基于对语音信号的研究,采用MEL频率倒谱系数对语音信号进行提取,动态规划的思想进行语音信号的匹配,以汽车天窗为控制对象,实现了系统样机的研制。测试结果表明,系统在车内噪音低于70分贝下的平均识别率高达93%。
关键词 mel频率谱系技术 语音控制 汽车天窗 单片机
下载PDF
基于翻转梅尔频率倒谱系数的语音变调检测方法 被引量:2
15
作者 林晓丹 邱应强 《计算机应用》 CSCD 北大核心 2019年第12期3510-3514,共5页
语音变调常用于掩盖说话人身份,各种变声软件的出现使得说话人身份伪装变得更加容易。针对现有变调语音检测方法无法判断语音是经过了何种变调操作(升调或降调)的问题,通过分析语音变调在信号频谱,尤其是高频区域留下的痕迹,提出了基于... 语音变调常用于掩盖说话人身份,各种变声软件的出现使得说话人身份伪装变得更加容易。针对现有变调语音检测方法无法判断语音是经过了何种变调操作(升调或降调)的问题,通过分析语音变调在信号频谱,尤其是高频区域留下的痕迹,提出了基于翻转梅尔倒谱系数(IMFCC)统计矩特征的电子变调语音检测方法。首先,提取各语音帧IMFCC及其一阶差分;然后,计算其统计均值;最后,在该统计特征上利用支持向量机(SVM)多分类器的设计来区分原始语音、升调语音和降调语音。在TIMIT和NIST语音集上的实验结果表明,所提方法无论对于原始语音、升调语音还是降调语音都具有良好的检测性能。与MFCC作为特征构造的基线系统相比,所设计的特征的方法明显提高了变调操作的识别率。在较少的训练资源的情况下,所提方法也获得了比基于卷积神经网络(CNN)的框架更好的性能;此外,在不同数据集和不同变调方法上也都取得了较好的泛化性能。 展开更多
关键词 语音变调 翻转梅尔频率 谱系 统计矩 多分类
下载PDF
基于Gammatone频率倒谱系数的舰船辐射噪声分析 被引量:2
16
作者 吴晏辰 王英民 《水下无人系统学报》 2021年第1期60-64,共5页
舰船辐射噪声的声学特征提取对目标训练和识别有着重要影响。文中提出一种基于Gammatone频率倒谱系数(GFCC)的特征分析方法:以目标特征提取方法——Mel频率倒谱系数(MFCC)算法作为比照组,针对小型低速船只、小型高速船只及大型船只三大... 舰船辐射噪声的声学特征提取对目标训练和识别有着重要影响。文中提出一种基于Gammatone频率倒谱系数(GFCC)的特征分析方法:以目标特征提取方法——Mel频率倒谱系数(MFCC)算法作为比照组,针对小型低速船只、小型高速船只及大型船只三大类目标,在2种不同水声环境中提取的5122个样本进行了分类识别比对试验。试验结果表明,2种算法的目标识别率均大于80%,且GFCC在海洋复杂声环境中的识别率显著高于MFCC,并对高频目标更敏感。说明GFCC算法与标准的MFCC算法相比,在海洋等强干扰环境下具有更好的抗噪性和更高的快速目标识别率。 展开更多
关键词 水下目标识别 舰船辐射噪声 特征提取 Gammatone频率谱系 mel频率谱系
下载PDF
一种声纹美尔频率倒谱系数干扰消除算法研究 被引量:2
17
作者 蒋琳琼 贺建飚 《计算机仿真》 CSCD 北大核心 2013年第4期382-385,共4页
在伴随着外部噪声的情况下,待识别的声纹美尔频率倒谱系数特征各项属性很容易受到外部噪声的干扰发生改变,造成声纹特征的识别的精度不高。为提高精度,提出了一种用支持向量机的美尔频率倒谱系数特征干扰去除算法。确定分类决策函数时... 在伴随着外部噪声的情况下,待识别的声纹美尔频率倒谱系数特征各项属性很容易受到外部噪声的干扰发生改变,造成声纹特征的识别的精度不高。为提高精度,提出了一种用支持向量机的美尔频率倒谱系数特征干扰去除算法。确定分类决策函数时充分考虑美尔频率倒谱系数与声纹中心以及噪声之间的关系,并且将声纹特征引入核函数,将原空间样本数据通过非线性变换映射到高维特征空间,在高维空间中求最优或广义最优分类面,实现对语音特征的干扰消除。实验表明,利用改进算法实现了声纹特征中过零率,倒谱特征、矩形窗和汉明窗长的短时能量函数特征的优化。 展开更多
关键词 声音参 美尔频率谱系 支持向量机
下载PDF
基于梅尔频率倒谱系数和支持向量机的汽车鸣喇叭声识别 被引量:7
18
作者 陈东 黄智鹏 《科学技术与工程》 北大核心 2021年第11期4486-4491,共6页
使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键。为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭... 使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键。为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭声和交通噪声的二分类器,针对汽车喇叭声的谐波特征分布特点,提取其梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为特征向量,并分析MFCC的梅尔滤波器个数及特征维数对识别效果的影响。实验结果表明,通过增加MFCC特征中梅尔滤波器个数及特征维数可以改善识别效果,信噪比越低越明显。 展开更多
关键词 汽车鸣喇叭声识别 梅尔频率谱系 支持向量机 特征识别
下载PDF
基于梅尔频率倒谱系数的音频分类研究 被引量:7
19
作者 屈晓渊 崔青 《电子设计工程》 2022年第9期82-87,92,共7页
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用在语音识别、音频特征分析等方面。对于目前广泛使用的通过单一特征进行音频分类的方法,存在分类准确... 梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用在语音识别、音频特征分析等方面。对于目前广泛使用的通过单一特征进行音频分类的方法,存在分类准确度低、处理速度慢等方面的不足,提出了基于梅尔频率倒谱的音频分类算法,该算法对音频设定采样率,获取音频的时间序列,并根据时间序列提取梅尔频率倒谱系数特征,将获取的二维特征值进行数据拟合、标准化处理。构建多层卷积神经网络模型,将标准化处理后的梅尔频率倒谱系数特征作为网络的输入,通过交叉熵验证的方法,对模型的输出进行分类。通过实验数据可知,梅尔频率倒谱系数特征通过多层卷积网络处理后,分类结果准确率达到92.8%,使用模型进行分类时,速度达到每个样本7 ms的耗时,模型能对音频进行准确快速的分类。 展开更多
关键词 梅尔频率谱系 音乐特征 音频分类 多层卷积神经网络
下载PDF
基于FPGA的Mel倒谱系数提取方法设计与实现
20
作者 杨鸿武 张帅 丁朋程 《仪表技术与传感器》 CSCD 北大核心 2017年第3期82-85,89,共5页
为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法。用SOPC Builder搭建硬件平台,然后在嵌入式NiosⅡ处理器中对语音信号做短... 为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法。用SOPC Builder搭建硬件平台,然后在嵌入式NiosⅡ处理器中对语音信号做短时傅里叶变换、对数幅度运算、逆傅里叶变换,最后通过牛顿迭代法实现Mel倒谱系数的求解。将NiosⅡ处理器得到的Mel倒谱系数通过JTAG接口回传到计算机上,并与MATLAB仿真结果进行比较,结果表明NiosⅡ处理器提取的Mel倒谱系数与MATLAB提取的系数结果相同。 展开更多
关键词 语音合成 现场可编程门阵列(FPGA) 可编程片上系统(SOPC) mel谱系 提取
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部