期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于MFCC-SVM和交叉验证方法的环境音分类 被引量:8
1
作者 李玲俐 《计算机与现代化》 2016年第8期36-39,共4页
用于音乐和语音的识别方法不适用于环境音的识别。提出一种基于MFCC(Mel频率倒谱系数)-SVM(支持向量机)的方法,使用特征表示和学习优化共同来实现办公室10种环境音的分类。环境音数据使用的是IEEE Audio and Acoustic Signal Processing... 用于音乐和语音的识别方法不适用于环境音的识别。提出一种基于MFCC(Mel频率倒谱系数)-SVM(支持向量机)的方法,使用特征表示和学习优化共同来实现办公室10种环境音的分类。环境音数据使用的是IEEE Audio and Acoustic Signal Processing(AASP)Challenge Dataset下载的标准数据集。在分析和优化SVM参数过程中,通过改变Mel系数参数的个数,充分考虑有效的MFCC特征表示。实验结果表明,使用MFCC特征和SVM分类器,采用5-折交叉验证的测试方法,得到的平均分类准确率可达88.05%,分类效果明显优于默认的MFCC-SVM算法。 展开更多
关键词 MEL频率倒谱系数 支持向量机 交叉验证 环境音分类 特征提取
下载PDF
基于主动学习的环境音分类研究
2
作者 张雁 吕丹桔 王红崧 《计算机技术与发展》 2014年第6期110-113,共4页
环境音分类是当前语音识别领域的研究热点。主动学习是利用未标记数据,在少量标记数据代价下提高监督学习算法的分类性能的方法。文中提出了熵优先采样(Entropy Priority Sampling,EPS)方法和简单不一致采样(Simple Disagreement Sampli... 环境音分类是当前语音识别领域的研究热点。主动学习是利用未标记数据,在少量标记数据代价下提高监督学习算法的分类性能的方法。文中提出了熵优先采样(Entropy Priority Sampling,EPS)方法和简单不一致采样(Simple Disagreement Sampling,SDS)方法作为主动学习选择样本的策略。针对环境音数据,提取11维的CELP音频特征,采用单一分类器与EPS,SDS方法对不同标记训练样本比例下的分类实验结果进行了比较分析。结果表明,主动学习方法在标记样本数较少的情况下,能取得较好的分类效果,并且EPS方法的性能优于SDS方法。 展开更多
关键词 主动学习 环境音分类 采样 熵优先采样 简单不一致采样
下载PDF
基于支持向量机模型的环境音分类研究 被引量:4
3
作者 张小梅 杨鼎才 《电子测量技术》 2008年第9期121-123,132,共4页
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频、视频检索和分析的基础。支持向量机(SVM)是一种有效的统计学习方法。本文提出了一种基于SVM的音频分类算法。将环境音分为6类:车鸣声,钟声,风声,冰块声,机床声和雨声。... 音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频、视频检索和分析的基础。支持向量机(SVM)是一种有效的统计学习方法。本文提出了一种基于SVM的音频分类算法。将环境音分为6类:车鸣声,钟声,风声,冰块声,机床声和雨声。特征抽取是音频分类的基础。本文从帧层次上深入分析了不同类音频之间的区别性特征,包括频域能量,子带能量,过零率,频率中心,带宽,基音频率及MFCC(Mel-Frequency Cepstral Coefficients)。实验结果表明,支持向量机模型的环境音分类性能较好,最优分类精度达到97.73%。 展开更多
关键词 环境音分类 支持向量机 MFCC
下载PDF
基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法 被引量:4
4
作者 王天锐 鲍骞月 秦品乐 《计算机应用》 CSCD 北大核心 2019年第12期3515-3521,共7页
针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加... 针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加窗、离散傅里叶变换、梅尔滤波器转换、离散余弦映射等方法建立梅尔倒谱系数特征模型;然后,将特征模型输入卷积深度网络进行第二次特征提取;最后,借鉴强化学习思想,用Bagging集成算法集成线性判别分析器、支持向量机(SVM)、Softmax回归、XGBoost四个模型,以投票预测的形式对网络输出结果进行预测。实验结果表明,所提方法能够有效提高对环境音的特征提取能力和深层网络在环境音分类上的抗过拟合能力。 展开更多
关键词 环境音分类 梅尔频率倒谱系数 Bagging集成算法 特征提取 深度学习
下载PDF
基于MFCC和加权动态特征组合的环境音分类 被引量:4
5
作者 魏丹芳 李应 《计算机与数字工程》 2010年第2期7-10,共4页
提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+αΔMFCC+βΔΔMFCC为特征参数的分类正确率明显高于MFCC、MFCC+ΔMFCC和MFCC+ΔMFCC+ΔΔMFCC。
关键词 MEL倒谱系数 差分Mel倒谱系数 环境音分类
下载PDF
Improved speech absence probability estimation based on environmental noise classification 被引量:2
6
作者 SON Young-ho LEE Sang-min 《Journal of Central South University》 SCIE EI CAS 2012年第9期2548-2553,共6页
An improved speech absence probability estimation was proposed using environmental noise classification for speech enhancement.A relevant noise estimation approach,known as the speech presence uncertainty tracking met... An improved speech absence probability estimation was proposed using environmental noise classification for speech enhancement.A relevant noise estimation approach,known as the speech presence uncertainty tracking method,requires seeking the "a priori" probability of speech absence that is derived by applying microphone input signal and the noise signal based on the estimated value of the "a posteriori" signal-to-noise ratio(SNR).To overcome this problem,first,the optimal values in terms of the perceived speech quality of a variety of noise types are derived.Second,the estimated optimal values are assigned according to the determined noise type which is classified by a real-time noise classification algorithm based on the Gaussian mixture model(GMM).The proposed algorithm estimates the speech absence probability using a noise classification algorithm which is based on GMM to apply the optimal parameter of each noise type,unlike the conventional approach which uses a fixed threshold and smoothing parameter.The performance of the proposed method was evaluated by objective tests,such as the perceptual evaluation of speech quality(PESQ) and composite measure.Performance was then evaluated by a subjective test,namely,mean opinion scores(MOS) under various noise environments.The proposed method show better results than existing methods. 展开更多
关键词 speech enhancement soft decision speech absence probability Gaussian mixture model (GMM)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部