期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
1
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 MEL频率倒谱系数 gammatone滤波器
下载PDF
基于GFCC和能量算子倒谱的语种识别 被引量:3
2
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率倒谱系数 有声无声段检测 Teager能量算子倒谱参数 主成分分析
下载PDF
基于Gammatone频率倒谱系数的舰船辐射噪声分析 被引量:2
3
作者 吴晏辰 王英民 《水下无人系统学报》 2021年第1期60-64,共5页
舰船辐射噪声的声学特征提取对目标训练和识别有着重要影响。文中提出一种基于Gammatone频率倒谱系数(GFCC)的特征分析方法:以目标特征提取方法——Mel频率倒谱系数(MFCC)算法作为比照组,针对小型低速船只、小型高速船只及大型船只三大... 舰船辐射噪声的声学特征提取对目标训练和识别有着重要影响。文中提出一种基于Gammatone频率倒谱系数(GFCC)的特征分析方法:以目标特征提取方法——Mel频率倒谱系数(MFCC)算法作为比照组,针对小型低速船只、小型高速船只及大型船只三大类目标,在2种不同水声环境中提取的5122个样本进行了分类识别比对试验。试验结果表明,2种算法的目标识别率均大于80%,且GFCC在海洋复杂声环境中的识别率显著高于MFCC,并对高频目标更敏感。说明GFCC算法与标准的MFCC算法相比,在海洋等强干扰环境下具有更好的抗噪性和更高的快速目标识别率。 展开更多
关键词 水下目标识别 舰船辐射噪声 特征提取 gammatone频率倒谱系数 MEL频率倒谱系数
下载PDF
基于GFCC-SVM-RFE的电力设备声音特征提取方法 被引量:1
4
作者 王赵国 韦存海 +3 位作者 彭雅妮 武明路 李军彬 翟永杰 《电力信息与通信技术》 2022年第9期34-42,共9页
火电厂电力设备声音包含了丰富的有效信息,但受限于复杂环境噪声,使得有效特征提取极其困难。为解决这一问题,文章提出一种基于GFCC-SVM-REF的特征提取方法,并在现场采集的6种设备运行声音、加入ESC-50公共数据集中的环境干扰音以及对... 火电厂电力设备声音包含了丰富的有效信息,但受限于复杂环境噪声,使得有效特征提取极其困难。为解决这一问题,文章提出一种基于GFCC-SVM-REF的特征提取方法,并在现场采集的6种设备运行声音、加入ESC-50公共数据集中的环境干扰音以及对原始设备声音加入不同分贝的高斯白噪声这3类数据上对2种经典语音识别领域的特征提取方法进行抗噪性和准确性的对比。仿真结果表明,针对所研究的数据集,GFCC-SVM-RFE方法在10 dB和20 dB的高斯白噪声下分别达到了81.04%和96.88%的准确率。 展开更多
关键词 电力设备 声音特征提取 环境噪音 梅尔频率倒谱系数 伽马通频率倒谱系数 支持向量机递归特征消除
下载PDF
基于MFCC和GFCC混合特征的语音情感识别研究 被引量:10
5
作者 郭卉 姜囡 任杰 《光电技术应用》 2019年第6期34-39,共6页
针对MFCC滤波器存在语音高频信号泄露的问题,为避免基于MFCC特征对语音进行情感识别时存在有效情感特征丢失的局限性,结合MFCC的高准确性和GFCC的强鲁棒性,提出了基于MFCC与GFCC混合特征训练CNN对语音进行情感识别的方法,有效提高了语... 针对MFCC滤波器存在语音高频信号泄露的问题,为避免基于MFCC特征对语音进行情感识别时存在有效情感特征丢失的局限性,结合MFCC的高准确性和GFCC的强鲁棒性,提出了基于MFCC与GFCC混合特征训练CNN对语音进行情感识别的方法,有效提高了语音情感识别的准确率,改善了CNN模型的识别性能。实验结果表明,所设计的混合特征识别方法较传统识别方法识别率明显升高并达到了83%,实现了语言情感识别准确率的有效提升。 展开更多
关键词 MFCC gfcc 语音情感识别 CNN 混合特征
下载PDF
一种舰载低信噪比环境下的音频端点检测算法 被引量:2
6
作者 王中正 王鉴 +1 位作者 韩焱 韩星程 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第3期197-203,共7页
针对舰载环境下音频端点检测准确率及鲁棒性较低的问题,提出了一种谱减法和朴素贝叶斯分类器相结合的音频端点检测算法。首先提取纯净音频信号MFCC0与GFCC0构建融合特征,与能熵比特征一同作为朴素贝叶斯分类器的输入进行训练及建模,再... 针对舰载环境下音频端点检测准确率及鲁棒性较低的问题,提出了一种谱减法和朴素贝叶斯分类器相结合的音频端点检测算法。首先提取纯净音频信号MFCC0与GFCC0构建融合特征,与能熵比特征一同作为朴素贝叶斯分类器的输入进行训练及建模,再利用多窗谱谱减法提升待测含噪信号信噪比,提取信号相关特征,朴素贝叶斯分类器根据待测信号特征判断该信号的类别。仿真实验结果表明,该算法针对舰载低信噪比含噪音频信号与传统方法相比有效降低了虚检和漏检,具有更好的准确性及鲁棒性。 展开更多
关键词 音频端点检测 多窗谱谱减法 Mel频率倒谱系数(MFCC) gammatone频率倒谱系数(gfcc) 朴素贝叶斯
下载PDF
基于深度自编码网络语音识别噪声鲁棒性研究 被引量:9
7
作者 黄丽霞 王亚楠 +1 位作者 张雪英 王洪翠 《计算机工程与应用》 CSCD 北大核心 2017年第13期49-54,共6页
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,... 为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。 展开更多
关键词 语音识别 鲁棒性 深度自编码网络 gfcc特征 MFCC特征
下载PDF
基于听觉感知特性的语音质量客观评价方法 被引量:6
8
作者 谭晓衡 许可 秦基伟 《西南交通大学学报》 EI CSCD 北大核心 2013年第4期756-760,共5页
讨论了基于MFCC(Mel-frequency cepstral coefficients)特征参数的语音质量客观评价方法 Mel-CD(Mel-cepstral distance measure).根据心理声学原理将Johannesma提出的人耳听觉模型和非线性压缩变换引入MFCC特征参数的提取过程,用Gammat... 讨论了基于MFCC(Mel-frequency cepstral coefficients)特征参数的语音质量客观评价方法 Mel-CD(Mel-cepstral distance measure).根据心理声学原理将Johannesma提出的人耳听觉模型和非线性压缩变换引入MFCC特征参数的提取过程,用Gammatone滤波器组对人耳基底膜进行仿真.利用改进后的MFCC作为语音信号特征参数,提出了一种更加符合人耳听觉感知特性的客观评价方法——Mel-GD(Mel-cepstral gammatone filter bankdistance measure).性能测试结果表明:所提算法与Mel-CD算法在时间复杂度上保持一致,评价结果的主观与客观的相关度提高了4.9%,平均估计偏差改善了45.5%. 展开更多
关键词 语音质量 MFCC gammatone滤波器组 非线性变换
下载PDF
法庭语音比对中话者自身变化性建模方法研究 被引量:2
9
作者 王华朋 姜囡 +1 位作者 刘恩 晁亚东 《计算机工程与应用》 CSCD 北大核心 2019年第8期110-115,214,共7页
针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人... 针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC(Mel Frequency Cepstral Coefficients)和GFCC(Gammatone Frequency Cepstral Coefficients)特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明:该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。 展开更多
关键词 似然比 证据强度 建模 梅尔频率倒谱系数(MFCC) 伽马通频率倒谱系数(gfcc)
下载PDF
多类型语音特征进化选择算法
10
作者 张小恒 谢文宾 李勇明 《计算机工程与应用》 CSCD 北大核心 2016年第14期150-155,219,共7页
基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式... 基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标(识别率,EER,DET曲线)上都有显著提高。 展开更多
关键词 说话人识别 多类型语音特征 链式智能体遗传算法 伽马通滤波器倒谱系数(gfcc) 梅尔频率倒谱系数(MFCC) 线性预测倒谱系数(LPCC)
下载PDF
噪声环境下多特征融合的语音端点检测方法 被引量:11
11
作者 罗思洋 龙华 +1 位作者 邵玉斌 杜庆治 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期671-680,共10页
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)的投... 针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上. 展开更多
关键词 语音端点检测 子带谱熵 Mel频率倒谱系数(MFCC) gammatone频率倒谱系数(gfcc) 多特征融合
下载PDF
基于CASA的噪声环境下的话者辨认
12
作者 李冬冬 唐建 +1 位作者 李然军 李辉 《小型微型计算机系统》 CSCD 北大核心 2016年第5期1107-1111,共5页
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码... 传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高. 展开更多
关键词 计算听觉场景分析 gammatone频率倒谱系数(gfcc) 理想二值掩码(IBM) 阈值
下载PDF
基于混合特征的说话人语音分割聚类研究 被引量:3
13
作者 刘景天 姜囡 《光电技术应用》 2019年第5期37-41,共5页
研究众多说话人语音中提取目标说话人语音的问题。为提高多说话人语音分割聚类的准确性,结合MFCC特征高准确性和GFCC特征强鲁棒性的特点,提出一种基于MFCC与GFCC混合特征的语音分割聚类算法,有效避免了含噪语音分割聚类鲁棒性较差等问... 研究众多说话人语音中提取目标说话人语音的问题。为提高多说话人语音分割聚类的准确性,结合MFCC特征高准确性和GFCC特征强鲁棒性的特点,提出一种基于MFCC与GFCC混合特征的语音分割聚类算法,有效避免了含噪语音分割聚类鲁棒性较差等问题。针对叠加粉红噪声和工厂噪声的实验语音,分别基于常规算法和改进的分割聚类算法进行对比分析,结果表明,所提出的基于混合特征的语音分割聚类算法提取目标人语音的准确性更具优势。 展开更多
关键词 语音分割聚类 梅尔频率倒谱系数 伽马通滤波器倒谱系数 鲁棒性
下载PDF
Research on Voiceprint Recognition of Camouflage Voice Based on Deep Belief Network 被引量:4
14
作者 Nan Jiang Ting Liu 《International Journal of Automation and computing》 EI CSCD 2021年第6期947-962,共16页
The problem of disguised voice recognition based on deep belief networks is studied. A hybrid feature extraction algorithm based on formants, Gammatone frequency cepstrum coefficients(GFCC) and their different coeffic... The problem of disguised voice recognition based on deep belief networks is studied. A hybrid feature extraction algorithm based on formants, Gammatone frequency cepstrum coefficients(GFCC) and their different coefficients is proposed to extract more discriminative speaker features from the original voice data. Using mixed features as the input of the model, a masquerade voice library is constructed. A masquerade voice recognition model based on a depth belief network is proposed. A dropout strategy is introduced to prevent overfitting, which effectively solves the problems of traditional Gaussian mixture models, such as insufficient modeling ability and low discrimination. Experimental results show that the proposed disguised voice recognition method can better fit the feature distribution, and significantly improve the classification effect and recognition rate. 展开更多
关键词 Disguised voice recognition deep belief network feature extraction gammatone frequency cepstrum coefficients(gfcc) DROPOUT
原文传递
Probability Enhanced Entropy(PEE) Novel Feature for Improved Bird Sound Classification 被引量:2
15
作者 Ramashini Murugaiya Pg Emeroylariffion Abas Liyanage Chandratilak De Silva 《Machine Intelligence Research》 EI CSCD 2022年第1期52-62,共11页
Identification of bird species from their sounds has become an important area in biodiversity-related research due to the relative ease of capturing bird sounds in the commonly challenging habitat. Audio features have... Identification of bird species from their sounds has become an important area in biodiversity-related research due to the relative ease of capturing bird sounds in the commonly challenging habitat. Audio features have a massive impact on the classification task since they are the fundamental elements used to differentiate classes. As such, the extraction of informative properties of the data is a crucial stage of any classification-based application. Therefore, it is vital to identify the most significant feature to represent the actual bird sounds. In this paper, we propose a novel feature that can advance classification accuracy with modified features, which are most suitable for classifying birds from its audio sounds. Modified Gammatone frequency cepstral coefficient(GTCC) features have been extracted with their frequency banks adjusted to suit bird sounds. The features are then used to train and test a support vector machine(SVM) classifier. It has been shown that the modified GTCC features are able to give 86% accuracy with twenty Bornean birds. Furthermore, in this paper, we are proposing a novel probability enhanced entropy(PEE) feature, which, when combined with the modified GTCC features, is able to improve accuracy further to 89.5%. These results are significant as the relatively low-resource intensive SVM with the proposed modified GTCC, and the proposed novel PEE feature can be implemented in a real-time system to assist researchers,scientists, conservationists, and even eco-tourists in identifying bird species in the dense forest. 展开更多
关键词 Bird sounds classification gammatone frequency cepstral coefficient(GTCC) probability enhanced entropy(PEE) support vector machine(SVM)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部