期刊文献+
共找到318篇文章
< 1 2 16 >
每页显示 20 50 100
基于MFCC和GMM的瓷砖空鼓率识别系统及方法
1
作者 周浩 梁军汀 卢杰 《无损检测》 CAS 2024年第3期28-32,55,共6页
针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试... 针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试验结果表明,采用MFCC和GMM相结合的方法,可以对瓷砖空鼓情况进行有效识别,该方法具有良好的应用前景。 展开更多
关键词 声纹识别 梅尔倒谱系数 混合高斯模型
下载PDF
基于MFCC-IMFCC混合倒谱的托辊轴承故障诊断
2
作者 陶瀚宇 陈换过 +2 位作者 彭程程 高祥冲 杨磊 《机电工程》 CAS 北大核心 2024年第7期1215-1222,共8页
针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了... 针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了托辊轴承故障信息主要分布在中高频区域;然后,为有效保留高频信息,提取了MFCC-IMFCC,以帧级串联的方式组成了混合倒谱特征;最后,将混合倒谱特征输入到双层LSTM模型中进行了训练,建立了托辊轴承故障诊断模型。研究结果表明:针对托辊正常、滚动体故障和偏心旋转故障三种状态,LSTM结合混合倒谱特征的平均识别准确率达到96.72%,相比于单一的MFCC和IMFCC特征,准确率分别提升3.94%和7.41%,凸显了混合倒谱特征在表征托辊轴承故障信息方面的显著优势。 展开更多
关键词 托辊轴承 轴承故障声音信号 高频信息 梅尔倒谱系数 翻转梅尔倒谱系数 混合倒谱系数 长短时记忆网络
下载PDF
基于MFCC和随机森林的GIS动作声纹特征辨识和操作机构异常分类
3
作者 庄小亮 李乾坤 +3 位作者 秦秉东 张长虹 张柳健 张禄亮 《电机与控制应用》 2024年第3期10-20,共11页
针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用M... 针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用MFCC提取声纹信号的特征;然后,构建随机森林对提取的特征信息进行辨识,得到GIS动作异常的分类结果;最后,以某110 kV的GIS设备为例,采集断路器、隔离开关的储能机构和传动机构异常或故障时的声纹信号,构建了音频样本库,并对所提分类模型与多种经典模型进行了对比测试。结果表明,MFCC能够有效提取出不同工况下GIS动作的声纹信号特征,且随机森林在众多分类识别模型中表现最优,有效提高了GIS动作异常工况识别的准确率。 展开更多
关键词 GIS动作异常 操作机构 声纹特征辨识 梅尔倒谱系数 随机森林
下载PDF
基于改进MFCC算法的风力机叶片故障诊断方法
4
作者 张家安 田家辉 +2 位作者 王铁成 邓强 梁涛 《太阳能学报》 EI CAS CSCD 北大核心 2024年第1期285-290,共6页
针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率... 针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率特性,明确叶片声音信号的频率分布区域,将全频段分为三部分;然后采用粒子群优化算法(PSO)对梅尔(Mel)函数在不同频段上的敏感度进行优化,在迭代过程中将MFCC算法提取的叶片声音特征进行聚类,以轮廓系数作为适应度函数;最后基于支持向量机(SVM)构建分类器,实现风力机叶片故障的准确识别。以华北某风电场的叶片声音采集数据为算例,考察该算法在不同风速工况下的适应性,验证该方法的有效性。 展开更多
关键词 风力机叶片 声信号处理 故障诊断 特征提取 梅尔频率倒谱系数
下载PDF
基于MFCC的碳纤维复合缠绕气瓶损伤声发射信号分析
5
作者 魏莱 龙飞飞 +1 位作者 杨可鑫 李沛莹 《无损检测》 CAS 2024年第4期53-58,共6页
针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势... 针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势进行同步比较。试验结果表明,不同损伤类型梅尔倒谱系数的分布呈现出明显的规律性。该研究结果可为CFPR材料的声发射检测信号识别提供一些参考。 展开更多
关键词 碳纤维复合缠绕气瓶 声发射 冲击 梅尔频率倒谱系数
下载PDF
基于MFCC与CNN的机械故障声音自动识别
6
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率倒谱系数(mfcc) 卷积神经网络(CNN)
下载PDF
语音信号特征提取中Mel倒谱系MFCC的改进算法 被引量:29
7
作者 张震 王化清 《计算机工程与应用》 CSCD 北大核心 2008年第22期54-55,58,共3页
从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传... 从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传统算法在语音识别系统中的差别。 展开更多
关键词 语音识别 特征提取 mfcc
下载PDF
Mel频率倒谱系数平滑的耳机均衡
8
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函数 mel频率倒谱系数 平滑 均衡 耳机声重放
下载PDF
基于MFCC声音特征信号提取的托辊故障诊断
9
作者 郭洁 井庆贺 +3 位作者 闫寿庆 王鑫 谢苗 吴意兵 《中国安全科学学报》 CAS CSCD 北大核心 2023年第S02期116-121,共6页
为监测托辊健康运行状态,通过现场试验的方式提取了托辊正常音频信号与故障音频信号。针对提取的音频信号中包含有大量噪声的问题,提出一种改进的小波阈值去噪方法,该方法有效滤除了音频信号中的噪声,为信号的后期特征提取奠定了基础。... 为监测托辊健康运行状态,通过现场试验的方式提取了托辊正常音频信号与故障音频信号。针对提取的音频信号中包含有大量噪声的问题,提出一种改进的小波阈值去噪方法,该方法有效滤除了音频信号中的噪声,为信号的后期特征提取奠定了基础。为进一步研究正常音频信号与故障音频信号的特性差异性,利用梅尔倒谱系数(MFCC)特征提取法,得出了能明显观测到托辊正常状态与故障状态差异性的梅尔倒谱系数特征表征图。结果表明:故障音频信号时域图与频谱图比正常音频信号波动更加剧烈;托辊正常音频信号的梅尔倒谱系数特性表征图比故障音频信号的起始幅值高,且幅值下降更迟缓。 展开更多
关键词 托辊故障 故障音频 小波阈值去噪 滤波器 梅尔倒谱系数(mfcc)
下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
10
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率倒谱系数(mfcc) 歌声伴奏分离 反复结构
下载PDF
基于特征融合和B-SVM的鸟鸣声识别算法 被引量:1
11
作者 陈晓 曾昭优 《声学技术》 CSCD 北大核心 2024年第1期119-126,共8页
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。... 为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。 展开更多
关键词 鸟鸣声识别 梅尔频率倒谱系数 线性判别算法 黑寡妇优化算法 支持向量机
下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
12
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率倒谱系数(mfcc) 高斯混合模型(GMM) 模型训练
下载PDF
梅尔频率倒谱系数在声带息肉手术前后嗓音分析中的价值研究
13
作者 刘茉 葛鑫颖 +2 位作者 赵晓畅 郝青青 李祖飞 《中国耳鼻咽喉颅底外科杂志》 CAS CSCD 2024年第2期102-105,共4页
目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年... 目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年龄(42.9±11.4)岁。另选取无声嘶且无声带病变的正常受试者21例作为基线对照。使用基于Python编程语言的librosa语音处理包进行MFCC特征提取,分别提取每位患者的MFCC均值,MFCC方差与MFCC标准差,使用配对样本t检验比较声带息肉手术前后上述各MFCC特征的差异。结果 声带息肉患者术后MFCC均值1.25±1.01、MFCC方差561.34±154.98及MFCC标准差21.74±4.03比术前MFCC均值6.81±2.05、MFCC方差1 019.66±295.87及MFCC标准差34.37±6.63显著下降,差异具有统计学意义(t=18.596,P=0.000;t=10.338,P=0.000;t=11.852,P=0.000)。声带息肉组患者术后1个月其MFCC均值、MFCC方差及MFCC标准差与正常受试者相比差异均无统计学意义,表明绝大部分声带息肉患者术后嗓音得到良好的恢复。结论 本研究首次探索了MFCC在声带息肉手术前后嗓音分析中的价值,MFCC各特征可作为评估声带息肉术后嗓音恢复的指标。 展开更多
关键词 声带息肉 声嘶 梅尔频率倒谱系数 嗓音分析 手术
下载PDF
基于多尺度时序感知网络的课堂语音情感识别方法
14
作者 周菊香 刘金生 +2 位作者 甘健侯 吴迪 李子杰 《计算机应用》 CSCD 北大核心 2024年第5期1636-1643,共8页
语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂... 语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂学习状态,从而达到精准施教的目的。针对课堂语音情感识别任务,首先,收集中小学的课堂实录教学视频,提取音频并进行人工切分和标注,构建了包含6类情感的中小学教学语音情感语料库;其次,基于时序卷积网络(TCN)和交叉门控机制(cross-gated mechanism)设计了双路时序卷积通道,以提取多尺度交叉融合特征;最后,采用动态权重融合策略调整不同尺度特征的贡献度,减少非重要特征对识别结果的干扰,进一步增强模型的表征和学习能力。实验结果表明,所提方法在多个公共数据集上优于TIM-Net(Temporal-aware bI-direction Multi-scaleNetwork)、GM-TCNet(Gated Multi-scale Temporal Convolutional Network)和CTL-MTNet(CapsNet and Transfer Learning-based Mixed Task Net)等先进模型,在真实课堂语音情感识别任务上未加权平均召回率(UAR)和加权平均召回率(WAR)分别达90.58%和90.45%。 展开更多
关键词 语音情感识别 课堂语音 时序卷积网络 交叉门控卷积 梅尔频率倒谱系数
下载PDF
基于改进MFCC和VQ的变压器声纹识别模型 被引量:84
15
作者 王丰华 王邵菁 +2 位作者 陈颂 袁国刚 张君 《中国电机工程学报》 EI CSCD 北大核心 2017年第5期1535-1542,共8页
为准确地获取变压器的噪声特性,该文提出了一种基于改进梅尔频率倒谱系数和矢量量化算法的变压器声纹识别模型。首先对变压器噪声信号进行分帧和加窗处理,然后综合运用加权处理法和主成分分析法对现有的MFCC特征向量提取算法进行改进,... 为准确地获取变压器的噪声特性,该文提出了一种基于改进梅尔频率倒谱系数和矢量量化算法的变压器声纹识别模型。首先对变压器噪声信号进行分帧和加窗处理,然后综合运用加权处理法和主成分分析法对现有的MFCC特征向量提取算法进行改进,进而基于VQ算法对变压器噪声信号进行识别。以某10k V变压器为对象进行空载试验,对不同铁芯松动下的噪声信号进行测试。计算结果表明,改进后的MFCC特征向量提取算法具有识别效率高和计算速度快的特点,所得到的MFCC特征向量能准确反映不同铁芯压紧程度下的变压器噪声特征,且基于VQ算法的识别结果与预设铁芯工况吻合良好。研究结果可为变压器结构优化设计及噪声治理提供依据。 展开更多
关键词 变压器 梅尔频谱倒谱系数 声纹识别 矢量量化 主成分分析 噪声
下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
16
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
下载PDF
基于MFCC和GMM的个性音乐推荐模型 被引量:11
17
作者 牛滨 孔令志 +2 位作者 罗森林 潘丽敏 郭亮 《北京理工大学学报》 EI CAS CSCD 北大核心 2009年第4期351-355,共5页
提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为... 提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%. 展开更多
关键词 音乐推荐 mel频率倒谱系数 高斯混合模型
下载PDF
Mel频率下基于LPC的语音信号深度特征提取算法 被引量:12
18
作者 罗元 吴承军 +2 位作者 张毅 黎小松 席兵 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第2期174-179,共6页
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法。该方法根据人耳的听觉特性把LPC在Mel频率下进行... 针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法。该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性。最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性。在一定程度上使语音控制智能轮椅更具实用性。 展开更多
关键词 语音识别 线性预测系数 mel频率倒谱系数 mel-LPC算法 深度特征提取
下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
19
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 mel倒谱系数 个性信息 mel倒谱系数 频谱分布 语音信号
下载PDF
基于Mel倒谱系数和矢量量化的昆虫声音自动鉴别 被引量:9
20
作者 竺乐庆 王鸿斌 张真 《昆虫学报》 CAS CSCD 北大核心 2010年第8期901-907,共7页
为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音... 为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音信号经过预处理、分段得到一系列的声音样本,从声音样本提取Mel倒谱系数(MFCC),并用Linde-Buzo-Gray(LBG)算法对提取的MFCC进行矢量量化(VQ),所得码字作为声音样本的特征模型。特征参数之间的匹配用搜索最近邻的方法实现。本文方法在包含70种昆虫声音的库中进行了试验,取得了超过96%的识别率和理想的时间性能。试验结果证明了该方法的有效性。 展开更多
关键词 昆虫 声音识别 mel倒谱系数 LBG算法 矢量量化
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部