期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
1
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率倒谱系数(MFCC) 歌声伴奏分离 反复结构
下载PDF
结合主分量分析及Fisher准则的说话人识别方法研究 被引量:3
2
作者 丁佩律 张立明 《电路与系统学报》 CSCD 2002年第1期116-119,共4页
本文提出了一种基于主分量分析和Fisher准则的新的Mel频率域特征参数。它是在Mel域频谱的基础上做主分量分析,并且根据Fisher准则,按Fisher比的大小进行特征参量的选择而得到的。它充分的利用了各频带间的相关统计信息,能更紧致有效的... 本文提出了一种基于主分量分析和Fisher准则的新的Mel频率域特征参数。它是在Mel域频谱的基础上做主分量分析,并且根据Fisher准则,按Fisher比的大小进行特征参量的选择而得到的。它充分的利用了各频带间的相关统计信息,能更紧致有效的区分说话人。这样得到的特征矢量,与传统的按相应特征值进行特征选择的方法相比,在相同维数时具有最大的类别区分度。最后我们实现了一个文本无关的说话人自动识别系统,它的后端采用矢量量化实现聚类分析。在语音库上的实验表明本文的特征矢量在说话人识别上比相同维数的传统特征矢量识别率更高,证实了它紧致、区分度好、冗余信息少的优良性能。 展开更多
关键词 主分量分析Fisher准则 说话人识别 语音识别
下载PDF
基于CCA和PCA的说话人特征降维研究 被引量:1
3
作者 陈觉之 张贵荣 周宇欢 《计算机与现代化》 2013年第6期16-19,共4页
为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降... 为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降维方法联合的降维效果与单一的CCA降维、PCA降维或手动降维的效果比有明显提高。 展开更多
关键词 说话人识别 典型相关分析 主成分分析 高斯混合模型 特征降维 线性预测系数 美尔频率倒谱系数
下载PDF
铁路隧道二次衬砌敲击检查声音特征分析及智能识别 被引量:5
4
作者 高磊 刘振奎 +2 位作者 魏晓悦 张昊宇 张奎 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2022年第7期1997-2004,共8页
为实现铁路隧道二次衬砌背后空洞智能诊断,基于声音识别技术,建立隧道空洞敲击检查声音智能识别模型。收集645段检查锤敲击衬砌的声音样本,运用信号特征分析的基本方法,分析有空洞和无空洞状态下声音信号的时域和频域特征,并提取24维梅... 为实现铁路隧道二次衬砌背后空洞智能诊断,基于声音识别技术,建立隧道空洞敲击检查声音智能识别模型。收集645段检查锤敲击衬砌的声音样本,运用信号特征分析的基本方法,分析有空洞和无空洞状态下声音信号的时域和频域特征,并提取24维梅尔频率倒谱系数作为机器学习数据集。用主成分分析法降维,经混合粒子群算法优化的支持向量机训练后,建立铁路隧道空洞敲击检查声音智能识别模型,将该模型应用于实际铁路隧道验证其有效性。建立的声音识别模型训练时长为31 s,准确率达95.56%,且能准确对实际工程中的声音样本做出分类。研究结果表明:对2种状态下的声音样本时域特征和频域特征进行对比和分析,不同状态下短时能量和声纹都出现明显的不同。运用PCA-混合PSO-SVM建立的声音识别模型,有着较高的准确率和较快的训练速度,能够根据敲击检查声音准确判断出隧道背后是否存在空洞,如何根据声音特征判断衬砌背后空洞的大小和深度等,将是下一步研究的重点。目前铁路隧道快速无损检测还无法大范围普及,人工检查仍是使用最广泛的检查方法,通过研究敲击检查声音智能识别,为隧道智能化诊断做出新的探索,对加快人工检查速度、提高信息化程度和实现无纸化作业有着重要的意义。 展开更多
关键词 铁路隧道工程 声音识别 梅尔频率倒谱系数 主成分分析 混合粒子群优化算法 支持向量机
下载PDF
基于二维主成分分析法的变压器声纹特征参数融合方法 被引量:2
5
作者 孙安青 贾廷波 +3 位作者 王丰华 杨秀龙 岳美 许景华 《广东电力》 2022年第9期127-134,共8页
运行中的变压器声信号以其非接触式测量、高灵敏度和强时效性等优点逐渐成为基于数据驱动模型的变压器状态监测领域的关注热点,如何从非平稳的声信号中获取合理有效及区分度高的声纹特征参数是变压器状态监测的关键。对此,在分别计算变... 运行中的变压器声信号以其非接触式测量、高灵敏度和强时效性等优点逐渐成为基于数据驱动模型的变压器状态监测领域的关注热点,如何从非平稳的声信号中获取合理有效及区分度高的声纹特征参数是变压器状态监测的关键。对此,在分别计算变压器声信号Mel频率倒谱系数和常Q倒谱系数特征参数的基础上,引入二维主成分分析法对这2种声纹特征参数进行融合降维,旨在降低数据维数的同时获取主要声纹特征,并以平均类间区分度表征声纹特征参数的区分度。某变压器不同直流偏磁状态下声信号的计算结果表明,所提出的变压器声信号特征参数表征方法更加全面高效且区分度高,可为变压器运行状态声信号监测技术提供重要参考。 展开更多
关键词 变压器 mel频率倒谱系数 常Q倒谱系数 二维主成分分析法 声信号
下载PDF
有向无环图拓扑的DBN多口音分类方法 被引量:1
6
作者 肖萌萌 徐志京 《小型微型计算机系统》 CSCD 北大核心 2019年第12期2545-2549,共5页
为了提高带有口音的说话人的语音识别的准确率,提出一种有向无环图-深度置信网络多口音分类的方法.通过提取说话人的梅尔频率倒谱系数及其一阶、二阶差分特征,获取语音参数的静态特性和动态特性.使用主成分分析对特征参数进行降维,减少... 为了提高带有口音的说话人的语音识别的准确率,提出一种有向无环图-深度置信网络多口音分类的方法.通过提取说话人的梅尔频率倒谱系数及其一阶、二阶差分特征,获取语音参数的静态特性和动态特性.使用主成分分析对特征参数进行降维,减少了计算复杂度.使用基于有向无环图拓扑结构的深度置信网络,不仅缩短了多口音分类的测试时间,同时能够得到较高的分类精度.使用TIMIT语音库进行实验测试,分类准确率达到87.46%,和其他多口音分类方法相比该方法明显提高了分类速度以及分类准确率. 展开更多
关键词 口音分类 梅尔频率倒谱系数 主成分分析 有向无环图 深度置信网络
下载PDF
基于PDA平台的实时说话人识别系统
7
作者 任舒彬 杨莹春 《电声技术》 2007年第1期47-50,共4页
受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以Mel倒谱系数为说话人特征,运用主成分分类技术,结合定点数计算技术实现实时说话人自动识别。在19个用户... 受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以Mel倒谱系数为说话人特征,运用主成分分类技术,结合定点数计算技术实现实时说话人自动识别。在19个用户的语音库上进行系统识别实验,此新型分类技术的训练时间缩短为基线系统的1/50,测试时间缩短为1/12,模型规模缩小为1/6,同时识别性能达到94.7%。 展开更多
关键词 个人数字助理 说话人识别 主成分分析分类 mel倒谱系数
下载PDF
基于HMM/SVM的抗噪语音特征提取及优化 被引量:9
8
作者 李婉玲 张秋菊 《传感器与微系统》 CSCD 2019年第4期55-58,共4页
为了提高语音识别的鲁棒性,提出一种新的特征组合方法。方法基于F比对梅尔频率倒谱系数(MFCC)进行加权优化,同时将不同特征组合输入到语音隐马尔科夫模型(HMM)进行训练,得到具有抗噪性的最佳组合,并采用主成分分析(PCA)进行降维,增加支... 为了提高语音识别的鲁棒性,提出一种新的特征组合方法。方法基于F比对梅尔频率倒谱系数(MFCC)进行加权优化,同时将不同特征组合输入到语音隐马尔科夫模型(HMM)进行训练,得到具有抗噪性的最佳组合,并采用主成分分析(PCA)进行降维,增加支持向量机(SVM)分类器作为后处理器。实验表明,改进的MFCC、短时平均能量和Teager能量算子组合参数识别效果最优,识别率达到90. 48%。PCA降维后识别率降低了0. 4%,提升了计算速度。增加后处理器,系统识别率达到95. 25%,提高了系统的识别效率和分类决策力,相对于常规识别方法,准确率有所提高。 展开更多
关键词 语音识别 梅尔频率倒谱系数 特征参数提取 主成分分析 隐马尔可夫模型 支持向量机
下载PDF
基于Mel频率倒谱系数的心音识别技术研究 被引量:2
9
作者 陈玮 赵屹华 +2 位作者 雷声 赵子恺 潘敏 《生物医学工程学杂志》 CAS CSCD 北大核心 2012年第6期1015-1020,共6页
心音是人体心脏搏动产生的具有个体特征的生理参数。实验利用小波变换实现对心音信号的去噪处理,选择Mel频率倒谱系数(MFCC)作为特征参量,并经过主成分分析(PCA)降维处理后用于个体分类识别中。旨在对心音作为生物识别特征参数可行性和... 心音是人体心脏搏动产生的具有个体特征的生理参数。实验利用小波变换实现对心音信号的去噪处理,选择Mel频率倒谱系数(MFCC)作为特征参量,并经过主成分分析(PCA)降维处理后用于个体分类识别中。旨在对心音作为生物识别特征参数可行性和识别方法做一个初步研究。实验结果显示,在选定的实验条件下,系统可以达到90%以上的识别率。可以为心音识别技术的进一步研究提供参考。 展开更多
关键词 生物识别 心音 小波去噪 mel频率倒谱系数 主成分分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部