期刊文献+
共找到107篇文章
< 1 2 6 >
每页显示 20 50 100
基于多尺度时序感知网络的课堂语音情感识别方法
1
作者 周菊香 刘金生 +2 位作者 甘健侯 吴迪 李子杰 《计算机应用》 CSCD 北大核心 2024年第5期1636-1643,共8页
语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂... 语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂学习状态,从而达到精准施教的目的。针对课堂语音情感识别任务,首先,收集中小学的课堂实录教学视频,提取音频并进行人工切分和标注,构建了包含6类情感的中小学教学语音情感语料库;其次,基于时序卷积网络(TCN)和交叉门控机制(cross-gated mechanism)设计了双路时序卷积通道,以提取多尺度交叉融合特征;最后,采用动态权重融合策略调整不同尺度特征的贡献度,减少非重要特征对识别结果的干扰,进一步增强模型的表征和学习能力。实验结果表明,所提方法在多个公共数据集上优于TIM-Net(Temporal-aware bI-direction Multi-scaleNetwork)、GM-TCNet(Gated Multi-scale Temporal Convolutional Network)和CTL-MTNet(CapsNet and Transfer Learning-based Mixed Task Net)等先进模型,在真实课堂语音情感识别任务上未加权平均召回率(UAR)和加权平均召回率(WAR)分别达90.58%和90.45%。 展开更多
关键词 语音情感识别 课堂语音 时序卷积网络 交叉门控卷积 梅尔频率倒谱系数
下载PDF
基于MFCC的语音情感识别 被引量:22
2
作者 韩一 王国胤 杨勇 《重庆邮电大学学报(自然科学版)》 2008年第5期597-602,共6页
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别... 情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。 展开更多
关键词 mfcc 语音情感识别 情感计算
下载PDF
融合LPC与MFCC的特征参数 被引量:8
3
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔倒谱系数 说话人识别
下载PDF
MFCC特征改进算法在语音识别中的应用 被引量:14
4
作者 俸云 景新幸 叶懋 《计算机工程与科学》 CSCD 北大核心 2009年第12期146-148,共3页
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。
关键词 语音识别 MEL倒谱系数 残差相位 线性预测
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
5
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 Mel频率倒谱系数(mfcc) 语音识别 特征提取
下载PDF
基于MFCC和时频图等多种特征的综合鸟声识别分类器设计 被引量:16
6
作者 徐淑正 孙忆南 +1 位作者 皇甫丽英 方玮骐 《实验室研究与探索》 CAS 北大核心 2018年第9期81-86,91,共7页
基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性... 基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性能。同时,系统在消除噪声和稳定性方面也做出了提高。经最终测试,本系统在多达11类的鸟声分类中可以达到92%的准确率。 展开更多
关键词 音频增强 语音信号处理 机器学习 梅尔频率倒谱系数
下载PDF
语音MFCC特征计算的改进算法 被引量:6
7
作者 章熙春 曹燕 +1 位作者 张军 韦岗 《数据采集与处理》 CSCD 北大核心 2005年第2期161-165,共5页
提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同... 提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weightedfilterbankanalysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。 展开更多
关键词 语音识别 弯折离散傅里叶变换(WDFT) Mel频标倒谱参数 加权滤波器分析
下载PDF
基于基音周期的语音MFCC参数提取 被引量:4
8
作者 陈迪 龚卫国 杨利平 《计算机应用》 CSCD 北大核心 2007年第5期1217-1219,共3页
提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无... 提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。 展开更多
关键词 说话人识别 基音周期 mfcc参数 频谱距离
下载PDF
MFCC中DCT结构的设计与实现 被引量:3
9
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率倒谱系数 离散余弦变换 分布式算法
下载PDF
基于样本熵与MFCC融合的语音情感识别 被引量:7
10
作者 屠彬彬 于凤芹 《计算机工程》 CAS CSCD 2012年第7期142-144,共3页
提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿... 提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿真实验结果表明,该方法的识别率较高。 展开更多
关键词 语音情感识别 样本熵 MEL频率倒谱系数 支持向量机
下载PDF
基于MFCCs滤波的电话语音识别的通道补偿方法 被引量:5
11
作者 韩纪庆 高文 《计算机学报》 EI CSCD 北大核心 1998年第12期1125-1130,共6页
本文提出一种基于MFCCs滤波的通道补偿方法RMFCC.它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价.RMFCC的性能也优于CMS和二级CMS.通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证... 本文提出一种基于MFCCs滤波的通道补偿方法RMFCC.它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价.RMFCC的性能也优于CMS和二级CMS.通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径. 展开更多
关键词 语音识别 mfccs滤波 电话语音识别 通道补偿
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:42
12
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 MEL频率倒谱系数 Gammatone滤波器
下载PDF
砂岩破裂状态声发射梅尔倒谱系数判识方法
13
作者 何学秋 杨菲 +5 位作者 李振雷 李娜 宋大钊 王洪磊 SOBOLEV Aleksei RASSKAZOV Igor 《煤炭学报》 EI CAS CSCD 北大核心 2024年第2期753-766,共14页
岩体结构破裂是严重制约矿山、地铁、隧道等地下空间工程建设及其安全运行的重要因素。实现对岩体结构破裂状态的识别是当下研究的热点与重点之一。为此,开展了不同条件的砂岩加载破坏实验,提取了加载全程的声发射梅尔倒谱系数及其波动... 岩体结构破裂是严重制约矿山、地铁、隧道等地下空间工程建设及其安全运行的重要因素。实现对岩体结构破裂状态的识别是当下研究的热点与重点之一。为此,开展了不同条件的砂岩加载破坏实验,提取了加载全程的声发射梅尔倒谱系数及其波动差,研究了系数及其波动差在砂岩受载破坏全程的变化规律,分析了1号系数(一组声发射梅尔倒谱系数包括12个,1号系数指第1个声发射梅尔倒谱系数)及其波动差与砂岩破裂状态的相关性特征,基于此提出了砂岩破裂状态声发射梅尔倒谱系数判识方法,构建了判识准则并进行判识效果检验。结果表明:随载荷增加,1号系数整体上增大,系数及其离散性在破坏阶段显著增大并表现出显著的规律波动性特征;1号系数波动差具有阶段性变化特征,波动差的大小及其起伏变化可表征砂岩的破裂,波动差整体增大及突增的变化可反映砂岩非稳定变形和峰后破坏阶段的宏观破裂,波动差的突增幅度可反映砂岩破裂程度;声发射梅尔倒谱系数及其波动差对砂岩破裂表现出良好的响应特征,该特征受不同加载条件的影响较小,说明声发射梅尔倒谱系数在反映砂岩破裂上具有适用性;1号系数及其波动差与砂岩破裂状态具有较好相关性,该相关性可分为3个阶段,即1号系数及其波动差在砂岩微破裂阶段分布集中,在临近失稳破坏阶段分布范围急剧增大、整体值升高且出现高异常值,在峰后破坏阶段分布范围进一步增大、整体值更高、高异常值更多;利用1号系数的75%位点值和异常值、1号系数波动差的75%位点值和异常值构建了砂岩破裂状态判识准则,采用三分类模型混淆矩阵对判识准则的效果进行了检验,判识准确度和精准度分别为90.43%、94.45%。该成果可为其他种类煤岩的破裂状态识别提供借鉴,为煤岩失稳监测预警提供参考。 展开更多
关键词 砂岩破裂状态 声发射 梅尔倒谱系数 判识方法
下载PDF
基于EMD的改进MFCC的语音情感识别 被引量:6
14
作者 屠彬彬 于凤芹 《计算机工程与应用》 CSCD 2012年第18期119-122,共4页
人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过... 人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。 展开更多
关键词 语音情感识别 MEL频率倒谱系数 经验模态分解 支持向量机
下载PDF
基于MFCC特征组合参数的说话人识别研究 被引量:2
15
作者 曾霞霞 徐戈 吴征远 《集美大学学报(自然科学版)》 CAS 2016年第4期317-320,共4页
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进... 为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 展开更多
关键词 说话人识别 MEL频率倒谱系数 高斯混合模型 特征参数 特征向量
下载PDF
结合残差相位的MFCC特征改进算法 被引量:1
16
作者 俸云 景新幸 《计算机仿真》 CSCD 北大核心 2009年第10期327-329,343,共4页
美尔频率倒谱参数(Mel frequency cepstral coefficient,MFCC)仿真了人耳的听觉特性,在语音识别实际应用中取得了比较高的识别率。为了更进一步完善系统以提高系统的识别率,提出一种将MFCC和残差相位相结合的方法进行语音识别。将传统... 美尔频率倒谱参数(Mel frequency cepstral coefficient,MFCC)仿真了人耳的听觉特性,在语音识别实际应用中取得了比较高的识别率。为了更进一步完善系统以提高系统的识别率,提出一种将MFCC和残差相位相结合的方法进行语音识别。将传统的基于MFCC的语音识别效果,与基于MFCC和残差相位相结合的语音识别效果进行比较。通过在MATLAB环境下进行仿真实验得出理想结论。利用MFCC和残差相位相结合的识别率高于MFCC的系统的识别率。所提出的改进算法更好的完善了识别系统,获得了更高的语音识别率。 展开更多
关键词 语音识别 美尔频率倒谱系数 残差相位 识别率
下载PDF
基于Bark子波变换的MFCC特征提取 被引量:5
17
作者 尹许梅 何选森 《计算机工程》 CAS CSCD 北大核心 2011年第11期192-194,共3页
为提高低信噪比环境下语音的鲁棒性,提出一种改进的Mel频率倒谱系数(MFCC)特征提取方法。在传统MFCC特征提取的基础上,引入更适应人耳听觉系统的Bark子波变换,在快速傅里叶变换之前对语音进行预处理,并在MFCC提取方法中代替离散余弦变换... 为提高低信噪比环境下语音的鲁棒性,提出一种改进的Mel频率倒谱系数(MFCC)特征提取方法。在传统MFCC特征提取的基础上,引入更适应人耳听觉系统的Bark子波变换,在快速傅里叶变换之前对语音进行预处理,并在MFCC提取方法中代替离散余弦变换;在语音预处理阶段,利用改进的Lanczos窗函数抑制旁瓣以提高语音鲁棒性。实验表明,与传统MFCC方法相比,在噪声环境下,改进方法具有更高的说话人识别率。 展开更多
关键词 说话人识别 MEL频率倒谱系数 Bark子波 窗函数
下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
18
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 Mel频率倒谱系数(mfcc) 小波分解 支持向量机
下载PDF
用于说话人识别的MFCC的改进算法 被引量:8
19
作者 张伟伟 杨鼎才 《电子测量技术》 2009年第8期118-121,共4页
在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于... 在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,以降低基音频率对其的影响。 展开更多
关键词 说话人识别 梅尔倒谱系数(mfcc) 基音频率
下载PDF
基于MFCC-IMFCC和GA-SVM的鸟声识别 被引量:7
20
作者 韩鹏飞 陈晓 《计算机系统应用》 2022年第11期393-399,共7页
鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC... 鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC应用于鸟声识别,提高对鸟声高频信息表征.同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化,训练出GA-SVM分类模型.实验表明,在同一条件下,MFCC-IMFCC与MFCC相比,识别率有一定的提高. 展开更多
关键词 梅尔倒谱系数 逆梅尔倒谱系数 FISHER准则 GA-SVM 声音识别
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部