期刊文献+
共找到303篇文章
< 1 2 16 >
每页显示 20 50 100
基于MFCC和GMM的瓷砖空鼓率识别系统及方法
1
作者 周浩 梁军汀 卢杰 《无损检测》 CAS 2024年第3期28-32,55,共6页
针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试... 针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试验结果表明,采用MFCC和GMM相结合的方法,可以对瓷砖空鼓情况进行有效识别,该方法具有良好的应用前景。 展开更多
关键词 声纹识别 梅尔倒谱系数 混合高斯模型
下载PDF
基于MFCC和随机森林的GIS动作声纹特征辨识和操作机构异常分类
2
作者 庄小亮 李乾坤 +3 位作者 秦秉东 张长虹 张柳健 张禄亮 《电机与控制应用》 2024年第3期10-20,共11页
针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用M... 针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用MFCC提取声纹信号的特征;然后,构建随机森林对提取的特征信息进行辨识,得到GIS动作异常的分类结果;最后,以某110 kV的GIS设备为例,采集断路器、隔离开关的储能机构和传动机构异常或故障时的声纹信号,构建了音频样本库,并对所提分类模型与多种经典模型进行了对比测试。结果表明,MFCC能够有效提取出不同工况下GIS动作的声纹信号特征,且随机森林在众多分类识别模型中表现最优,有效提高了GIS动作异常工况识别的准确率。 展开更多
关键词 GIS动作异常 操作机构 声纹特征辨识 梅尔倒谱系数 随机森林
下载PDF
基于改进MFCC算法的风力机叶片故障诊断方法
3
作者 张家安 田家辉 +2 位作者 王铁成 邓强 梁涛 《太阳能学报》 EI CAS CSCD 北大核心 2024年第1期285-290,共6页
针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率... 针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率特性,明确叶片声音信号的频率分布区域,将全频段分为三部分;然后采用粒子群优化算法(PSO)对梅尔(Mel)函数在不同频段上的敏感度进行优化,在迭代过程中将MFCC算法提取的叶片声音特征进行聚类,以轮廓系数作为适应度函数;最后基于支持向量机(SVM)构建分类器,实现风力机叶片故障的准确识别。以华北某风电场的叶片声音采集数据为算例,考察该算法在不同风速工况下的适应性,验证该方法的有效性。 展开更多
关键词 风力机叶片 声信号处理 故障诊断 特征提取 梅尔频率倒谱系数
下载PDF
语音信号特征提取中Mel倒谱系MFCC的改进算法 被引量:29
4
作者 张震 王化清 《计算机工程与应用》 CSCD 北大核心 2008年第22期54-55,58,共3页
从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传... 从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传统算法在语音识别系统中的差别。 展开更多
关键词 语音识别 特征提取 mfcc
下载PDF
Mel频率倒谱系数平滑的耳机均衡
5
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函数 mel频率倒谱系数 平滑 均衡 耳机声重放
下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
6
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率倒谱系数(mfcc) 歌声伴奏分离 反复结构
下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
7
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率倒谱系数(mfcc) 高斯混合模型(GMM) 模型训练
下载PDF
基于特征融合和B-SVM的鸟鸣声识别算法
8
作者 陈晓 曾昭优 《声学技术》 CSCD 北大核心 2024年第1期119-126,共8页
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。... 为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。 展开更多
关键词 鸟鸣声识别 梅尔频率倒谱系数 线性判别算法 黑寡妇优化算法 支持向量机
下载PDF
梅尔频率倒谱系数在声带息肉手术前后嗓音分析中的价值研究
9
作者 刘茉 葛鑫颖 +2 位作者 赵晓畅 郝青青 李祖飞 《中国耳鼻咽喉颅底外科杂志》 CAS CSCD 2024年第2期102-105,共4页
目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年... 目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年龄(42.9±11.4)岁。另选取无声嘶且无声带病变的正常受试者21例作为基线对照。使用基于Python编程语言的librosa语音处理包进行MFCC特征提取,分别提取每位患者的MFCC均值,MFCC方差与MFCC标准差,使用配对样本t检验比较声带息肉手术前后上述各MFCC特征的差异。结果 声带息肉患者术后MFCC均值1.25±1.01、MFCC方差561.34±154.98及MFCC标准差21.74±4.03比术前MFCC均值6.81±2.05、MFCC方差1 019.66±295.87及MFCC标准差34.37±6.63显著下降,差异具有统计学意义(t=18.596,P=0.000;t=10.338,P=0.000;t=11.852,P=0.000)。声带息肉组患者术后1个月其MFCC均值、MFCC方差及MFCC标准差与正常受试者相比差异均无统计学意义,表明绝大部分声带息肉患者术后嗓音得到良好的恢复。结论 本研究首次探索了MFCC在声带息肉手术前后嗓音分析中的价值,MFCC各特征可作为评估声带息肉术后嗓音恢复的指标。 展开更多
关键词 声带息肉 声嘶 梅尔频率倒谱系数 嗓音分析 手术
下载PDF
基于改进MFCC和VQ的变压器声纹识别模型 被引量:76
10
作者 王丰华 王邵菁 +2 位作者 陈颂 袁国刚 张君 《中国电机工程学报》 EI CSCD 北大核心 2017年第5期1535-1542,共8页
为准确地获取变压器的噪声特性,该文提出了一种基于改进梅尔频率倒谱系数和矢量量化算法的变压器声纹识别模型。首先对变压器噪声信号进行分帧和加窗处理,然后综合运用加权处理法和主成分分析法对现有的MFCC特征向量提取算法进行改进,... 为准确地获取变压器的噪声特性,该文提出了一种基于改进梅尔频率倒谱系数和矢量量化算法的变压器声纹识别模型。首先对变压器噪声信号进行分帧和加窗处理,然后综合运用加权处理法和主成分分析法对现有的MFCC特征向量提取算法进行改进,进而基于VQ算法对变压器噪声信号进行识别。以某10k V变压器为对象进行空载试验,对不同铁芯松动下的噪声信号进行测试。计算结果表明,改进后的MFCC特征向量提取算法具有识别效率高和计算速度快的特点,所得到的MFCC特征向量能准确反映不同铁芯压紧程度下的变压器噪声特征,且基于VQ算法的识别结果与预设铁芯工况吻合良好。研究结果可为变压器结构优化设计及噪声治理提供依据。 展开更多
关键词 变压器 梅尔频谱倒谱系数 声纹识别 矢量量化 主成分分析 噪声
下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
11
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
下载PDF
Mel频率下基于LPC的语音信号深度特征提取算法 被引量:12
12
作者 罗元 吴承军 +2 位作者 张毅 黎小松 席兵 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第2期174-179,共6页
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法。该方法根据人耳的听觉特性把LPC在Mel频率下进行... 针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法。该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性。最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性。在一定程度上使语音控制智能轮椅更具实用性。 展开更多
关键词 语音识别 线性预测系数 mel频率倒谱系数 mel-LPC算法 深度特征提取
下载PDF
基于MFCC和GMM的个性音乐推荐模型 被引量:10
13
作者 牛滨 孔令志 +2 位作者 罗森林 潘丽敏 郭亮 《北京理工大学学报》 EI CAS CSCD 北大核心 2009年第4期351-355,共5页
提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为... 提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%. 展开更多
关键词 音乐推荐 mel频率倒谱系数 高斯混合模型
下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
14
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 mel倒谱系数 个性信息 mel倒谱系数 频谱分布 语音信号
下载PDF
基于Mel倒谱系数和矢量量化的昆虫声音自动鉴别 被引量:9
15
作者 竺乐庆 王鸿斌 张真 《昆虫学报》 CAS CSCD 北大核心 2010年第8期901-907,共7页
为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音... 为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音信号经过预处理、分段得到一系列的声音样本,从声音样本提取Mel倒谱系数(MFCC),并用Linde-Buzo-Gray(LBG)算法对提取的MFCC进行矢量量化(VQ),所得码字作为声音样本的特征模型。特征参数之间的匹配用搜索最近邻的方法实现。本文方法在包含70种昆虫声音的库中进行了试验,取得了超过96%的识别率和理想的时间性能。试验结果证明了该方法的有效性。 展开更多
关键词 昆虫 声音识别 mel倒谱系数 LBG算法 矢量量化
下载PDF
基于声音特征的隧道衬砌空洞识别方法研究
16
作者 代晓景 暴学志 +2 位作者 柴雪松 周城光 阎兆立 《声学技术》 CSCD 北大核心 2024年第1期135-141,共7页
目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过... 目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过提取隧道衬砌冲击回波的梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)作为特征,针对敲击回声脉冲信号长度不一的特点,提出了变帧长MFCC优化算法,并面向小样本条件,建立了支持向量机(Support Vector Machine,SVM)的识别模型。试验结果表明,该模型对衬砌空洞识别准确率可达89.9%。 展开更多
关键词 隧道衬砌空洞 声学信号处理 梅尔倒谱系数(mfcc) 支持向量机(SVM)
下载PDF
基于MFCC和GMM的昆虫声音自动识别 被引量:15
17
作者 竺乐庆 张真 《昆虫学报》 CAS CSCD 北大核心 2012年第4期466-471,共6页
昆虫的运动、取食、鸣叫都会发出声音,这些声音存在种内相似性和种间差异性,因此可用来识别昆虫的种类。基于昆虫声音的昆虫种类自动检测技术对协助农业和林业从业人员方便地识别昆虫种类非常有意义。本研究采用了语音识别领域里的声音... 昆虫的运动、取食、鸣叫都会发出声音,这些声音存在种内相似性和种间差异性,因此可用来识别昆虫的种类。基于昆虫声音的昆虫种类自动检测技术对协助农业和林业从业人员方便地识别昆虫种类非常有意义。本研究采用了语音识别领域里的声音参数化技术来实现昆虫的声音自动鉴别。声音样本经预处理后,提取梅尔倒谱系数(Mel-frequency cepstrum coefficient,MFCC)作为特征,并用这些样本提取的MFCC特征集训练混合高斯模型(Gaussian mixturemodel,GMM)。最后用训练所得到的GMM对未知类别的昆虫声音样本进行分类。该方法在包含58种昆虫声音的样本库中进行了评估,取得了较高的识别正确率(平均精度为98.95%)和较理想的时间性能。该测试结果证明了基于MFCC和GMM的语音参数化技术可以用来有效地识别昆虫种类。 展开更多
关键词 昆虫 种类鉴定 声音处理 自动识别 梅尔倒谱系数 混合高斯模型
下载PDF
基于Mel频率倒谱系数和遗传算法的煤矸界面识别研究 被引量:6
18
作者 何爱香 王平建 +1 位作者 魏广芬 张守祥 《工矿自动化》 北大核心 2013年第2期66-71,共6页
针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放... 针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放落过程中产生的声波信号的特征差异进行煤矸识别,采用Mel频率倒谱系数将去噪后的煤矸声波信号变换到频域进行处理,提取出煤矸声波信号的32维特征参数;采用遗传算法优化处理32维特征参数,得到最优参数组合;采用支持向量机和BP神经网络对最优参数进行识别。实验结果表明,该方法能够准确识别出煤矸下落状态。 展开更多
关键词 放顶煤开采 煤矸界面识别 mel频率倒谱系数 mfcc 遗传算法 支持向量机 BP神经网络
下载PDF
差分和加权Mel倒谱混合参数应用于说话人识别 被引量:14
19
作者 柯晶晶 周萍 +1 位作者 景新幸 杨青 《微电子学与计算机》 CSCD 北大核心 2014年第9期88-91,共4页
说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权... 说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权特征参数与反映语音帧间变化的差分Mel频率倒谱系数进行维度筛选,再进行参数混合.实验结果表明,通过改进加权函数提取得到的特征参数与差分Mel频率倒谱系数的混合参数在矢量量化的说话人识别系统中,码本容量为16和32时可以达到100%的识别率. 展开更多
关键词 说话人识别 加权mel频率倒谱系数 混合参数 矢量量化
下载PDF
基于MFCC和短时能量混合的异常声音识别算法 被引量:28
20
作者 吕霄云 王宏霞 《计算机应用》 CSCD 北大核心 2010年第3期796-798,共3页
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统... 针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。 展开更多
关键词 异常声音识别 梅尔倒谱系数 短时能量 高斯混合模型
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部