期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于概率模型和倒谱差分的特征补偿算法 被引量:1
1
作者 马治飞 徐望 +1 位作者 王炳锡 王兴斌 《计算机工程》 EI CAS CSCD 北大核心 2006年第18期200-201,205,共3页
在概率模型中,给出了引入倒谱预测值的动态相关性来进行特征补偿的方法。该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度,在倒谱域中对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度。不... 在概率模型中,给出了引入倒谱预测值的动态相关性来进行特征补偿的方法。该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度,在倒谱域中对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度。不同噪声环境和不同信噪比下的实验结果表明,该方法能有效地提高噪声环境下的中文连续语音识别的正确率。 展开更多
关键词 语音识别 噪声抑止 差分 概率模型
下载PDF
一种基于概率模型和倒谱差分的特征补偿算法
2
作者 马治飞 徐望 +1 位作者 王炳锡 王兴斌 《信号处理》 CSCD 北大核心 2005年第z1期192-195,共4页
本文详细给出了概率模型中引入倒谱预测值的动态相关性来进行特征补偿的方法.该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度、在倒谱域对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度.... 本文详细给出了概率模型中引入倒谱预测值的动态相关性来进行特征补偿的方法.该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度、在倒谱域对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度.不同噪声环境和不同信噪比下的实验结果表明,本文方法能有效提高噪声环境下的中文连续语音识别的正确率. 展开更多
关键词 语音识别 噪声抑止 差分 概率模型
下载PDF
融合韵律与动态倒谱特征的语音疲劳度检测 被引量:2
3
作者 吴礼福 徐行 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期709-714,共6页
通过语音实现疲劳度检测具有操作简单、无创伤和实时性等优点.为了提高语音疲劳度检测的性能,将韵律特征与动态倒谱特征相融合,采用高斯混合模型作为分类器进行语音疲劳度检测.分别考察了梅尔频率倒谱系数、滑动差分倒谱特征以及韵律特... 通过语音实现疲劳度检测具有操作简单、无创伤和实时性等优点.为了提高语音疲劳度检测的性能,将韵律特征与动态倒谱特征相融合,采用高斯混合模型作为分类器进行语音疲劳度检测.分别考察了梅尔频率倒谱系数、滑动差分倒谱特征以及韵律特征的检测性能.实验结果表明,在单特征时,梅尔频率倒谱系数比滑动差分倒谱特征和韵律特征的检测性能好,对于融合特征,检测性能均比单特征好,将三个特征融合后,检测正确率可达91%. 展开更多
关键词 疲劳度 梅尔频率系数 滑动差分倒谱 高斯混合模型
下载PDF
基于滑动倒谱的自动语言辨识 被引量:4
4
作者 王洪海 刘刚 郭军 《智能系统学报》 2008年第4期336-341,共6页
滑动差分倒谱在自动语言辨识的研究中获得了广泛的应用.但是滑动差分倒谱并没有利用语音信号的静态倒谱信息,在方言辨识中的研究表明静态倒谱比差分倒谱含有更多的特征信息.为此,提出了滑动倒谱(SC)的概念,并与滑动差分倒谱特征矢量进... 滑动差分倒谱在自动语言辨识的研究中获得了广泛的应用.但是滑动差分倒谱并没有利用语音信号的静态倒谱信息,在方言辨识中的研究表明静态倒谱比差分倒谱含有更多的特征信息.为此,提出了滑动倒谱(SC)的概念,并与滑动差分倒谱特征矢量进行了对比研究.首先利用开发集的语音考察了滑动差分倒谱和滑动倒谱的控制参数在不同取值的情况下对识别性能的影响,利用爬山法确定了这2类特征矢量达到局部最优控制参数组合的路径,然后利用测试集的数据对优化后的2类特征矢量建立的模型进行了闭集辨识和开集辨识.2种情况下的测试结果都表明滑动倒谱的性能优于滑动差分倒谱.并且这2种参数还具有特征互补性,将它们进行决策级数据融合可以进一步提高系统的性能. 展开更多
关键词 自动语言辨识 滑动 滑动差分倒谱 高斯混合模型
下载PDF
基于自适应高斯混合模型与静动态听觉特征融合的说话人识别 被引量:18
5
作者 吴迪 曹洁 王进花 《光学精密工程》 EI CAS CSCD 北大核心 2013年第6期1598-1604,共7页
对特征参数和高斯混合模型进行改进,提出了一种特征域和模型域混合补偿的方法用于解决说话人识别特征受噪声影响较大以及高斯混合模型随训练样本长度减小而性能下降的问题。通过模拟人耳听觉,给出了基于伽马通滤波器的伽马通滤波倒谱系... 对特征参数和高斯混合模型进行改进,提出了一种特征域和模型域混合补偿的方法用于解决说话人识别特征受噪声影响较大以及高斯混合模型随训练样本长度减小而性能下降的问题。通过模拟人耳听觉,给出了基于伽马通滤波器的伽马通滤波倒谱系数;考虑其只反映了语音的静态特征,提取了能够反映语音动态特征的伽马通滑动差分倒谱系数。基于因子分析技术,利用移动因子表示高斯混合模型的自适应过程,通过训练语料较充分的说话人模型中的均值向量补偿受训练语料长度影响较大的分量的均值向量。仿真实验表明:在纯净背景下,本文方法的识别率达到了98.46%;在不同噪声环境下,本文提出的混合补偿方法能有效提高说话人识别系统的性能。 展开更多
关键词 高斯混合模型 伽马通滤波器 滑动差分倒谱 因子分析 听觉特征
下载PDF
几种语音识别特征参数的研究 被引量:19
6
作者 刘雅琴 智爱娟 《计算机技术与发展》 2009年第12期67-70,共4页
语音识别就是研究让机器最终能听懂人类口述的自然语言的一门学科,具有广阔的应用前景。在语音识别系统中,提取语音的特征参数是系统的关键问题之一。文中首先分析了常用的线性预测参数LPCC、梅尔倒谱参数MFCC及其它们的一阶差分△LPCC... 语音识别就是研究让机器最终能听懂人类口述的自然语言的一门学科,具有广阔的应用前景。在语音识别系统中,提取语音的特征参数是系统的关键问题之一。文中首先分析了常用的线性预测参数LPCC、梅尔倒谱参数MFCC及其它们的一阶差分△LPCC和△MFCC的原理和实现方法,提取了LPCC+△LPCC和MFCC+△MFCC两种参数。其次,讨论了动态时间弯折DTW识别算法。最后,在Matlab平台上,分别采用LPCC、LPCC+△LPCC,MFCC、MFCC+△MFCC作为特征参数结合DTW识别算法进行实验仿真,结果表明MFCC+△MFCC参数的识别率最高,LPCC的识别率最低。 展开更多
关键词 特征参数 LPCC 差分倒谱 DTW
下载PDF
一种改进动态特征参数的话者语音识别系统 被引量:4
7
作者 申小虎 万荣春 张新野 《计算机仿真》 CSCD 北大核心 2015年第4期154-158,共5页
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种... 研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。 展开更多
关键词 话者语音识别系统 美尔频率系数 滑动差分倒谱特征 动态时频系数 混合高斯-通用背景模型
下载PDF
EMD-SDC方法在机载连接词语音识别系统中的应用 被引量:1
8
作者 严家明 李永恒 《计算机工程与应用》 CSCD 2012年第8期137-140,共4页
机载连接词语音识别系统与传统语音识别系统相比,具有背景噪声大,系统识别率要求高等特点。依据这些特点,提出了一种基于经验模态分解增强和位移差分倒谱特征的EMD-SDC连接词语音识别方法。经验模态分解的调频调幅特性,可以有效提高机... 机载连接词语音识别系统与传统语音识别系统相比,具有背景噪声大,系统识别率要求高等特点。依据这些特点,提出了一种基于经验模态分解增强和位移差分倒谱特征的EMD-SDC连接词语音识别方法。经验模态分解的调频调幅特性,可以有效提高机载复杂噪声背景下的端点检测准确度,位移差分倒谱特征由语音帧的一阶差分谱连接扩展而成,能够更好地提取依赖于语言结构的时序信息。该方法对机载交通预警避撞系统提示语音库进行测试,实验结果表明,采用EMD-SDC方法的机载连接词语音识别系统,能够很好地克服机舱背景噪声干扰,在低信噪比条件下实现较高的识别率。 展开更多
关键词 经验模态分解 位移差分倒谱 机载连接词语音识别
下载PDF
基于改进型DTW算法和MFCC的语音识别 被引量:9
9
作者 陈孟元 《安徽工程大学学报》 CAS 2014年第1期53-57,共5页
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一... 采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果. 展开更多
关键词 语音识别 改进型DTW 差分倒谱参数软件 MATLAB
下载PDF
加性白噪声环境下语音特征参数鲁棒性的研究 被引量:1
10
作者 孙林慧 杨震 《南京邮电学院学报(自然科学版)》 EI 2005年第5期53-56,共4页
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪... 随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。 展开更多
关键词 鲁棒性 Mel参数 Mel差分倒谱 系数零均值化
下载PDF
一种基于段级特征和自动标识的语言辨识算法
11
作者 张文林 屈丹 +2 位作者 李弼程 王波 王炳锡 《信号处理》 CSCD 北大核心 2008年第4期655-658,共4页
本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- a... 本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果。相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果。 展开更多
关键词 语言辨识 移位差分倒谱 段级特征参数 高斯混合模型 多元语言模型 支持向量机
下载PDF
一种静态特征与动态特征结合的方言辨识方法 被引量:2
12
作者 何艳 于凤芹 《计算机工程与应用》 CSCD 2012年第13期105-108,共4页
针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组... 针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组合送入支持向量机进行辨识,并研究了针对4种方言的SDC的局部最优参数组合。仿真实验结果表明,同时考虑方言的静态与动态特征方法的识别率高达92.5%,但识别率的提高是以延长运算时间为代价的。 展开更多
关键词 方言辨识 MEL频率系数 滑动差分倒谱特征 支持向量机
下载PDF
自动语言辨识的研究方法及发展概述 被引量:1
13
作者 王洪海 刘刚 郭军 《电脑与信息技术》 2007年第2期37-39,共3页
根据自动语言辨识研究中所采用的识别信息的不同,文章将研究中使用的方法归类为基于声学特征的方法、基于韵律特征的方法、基于音素识别的方法和基于高层语言信息的方法。通过对这些方法进行分类介绍并结合NIST的评测结果分析,阐述了近... 根据自动语言辨识研究中所采用的识别信息的不同,文章将研究中使用的方法归类为基于声学特征的方法、基于韵律特征的方法、基于音素识别的方法和基于高层语言信息的方法。通过对这些方法进行分类介绍并结合NIST的评测结果分析,阐述了近十几年来自动语言辨识研究的发展情况,最后对进一步研究中存在的问题和发展趋势进行了分析。 展开更多
关键词 自动语言辨识 滑动差分倒谱 连续语音识别 概述
下载PDF
噪声背景下语音识别特征参数选择研究 被引量:3
14
作者 刘顺兰 窦园园 应娜 《杭州电子科技大学学报(自然科学版)》 2011年第4期73-76,共4页
为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响。在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实... 为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响。在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实验研究,结果表明:在保证系统有较高识别率的情况下,在低信噪比时,含白噪声的语音信号缺失美尔频率倒谱系数静态特征及其一阶差分的低阶分量,有助于提升识别率;含粉红噪声的语音识别系统和含工厂噪声的语音识别系统,不能缺失美尔倒谱频率系数和美尔倒谱频率系数的一阶差分的任何特征分量;含车载噪声的语音可以缺失部分高阶MFCC分量和部分一阶差分分量。 展开更多
关键词 语音识别 特征提取 美尔频率系数 美尔频率系数的一阶差分
下载PDF
一种新的低俗语音识别方法
15
作者 周建政 《计算机工程与应用》 CSCD 2013年第1期156-158,共3页
为了应对低俗视频语音等多媒体信息在网络上的大量传播,提出了一种基于移位差分倒谱参数特征的低俗语音识别方法。该方法对输入的语音信号进行分帧,提取移位差分倒谱参数特征,采用了高斯混合模型进行粗分类,对粗分为低俗的语音帧再用支... 为了应对低俗视频语音等多媒体信息在网络上的大量传播,提出了一种基于移位差分倒谱参数特征的低俗语音识别方法。该方法对输入的语音信号进行分帧,提取移位差分倒谱参数特征,采用了高斯混合模型进行粗分类,对粗分为低俗的语音帧再用支持向量机分类器进行确认。实验结果表明,该方法具有较高的正识别率和较低的误识别率,可用于网络上低俗语音和视频信息的过滤。 展开更多
关键词 不良信息过滤 低俗语音识别 移位差分倒谱参数 高斯混合模型 支持向量机
下载PDF
基于改进DTW算法的窨井盖盗损检测方法
16
作者 李林丰 薛波 《电声技术》 2022年第9期111-116,共6页
针对城市窨井盖被盗或被损坏的现象,提出一种基于改进动态时间规整(Dynamic Time Warping,DTW)算法的窨井盖盗损检测方法。根据窨井盖在正常振动与非正常振动下产生的声纹差异,采用梅尔倒谱系数(Mel-frequency Cepstral Coefficients,MF... 针对城市窨井盖被盗或被损坏的现象,提出一种基于改进动态时间规整(Dynamic Time Warping,DTW)算法的窨井盖盗损检测方法。根据窨井盖在正常振动与非正常振动下产生的声纹差异,采用梅尔倒谱系数(Mel-frequency Cepstral Coefficients,MFCC)并整合差分倒谱系数作为特征参数,结合改进的DTW算法进行声纹识别。通过调整动态时间规整函数,将传统DTW算法搜索区域约束为较小面积的菱形,使其达到减小存储空间和缩短识别时间的目的。仿真实验结果表明,铁锤敲击井盖声、车辆碾压井盖声等七种声音类型的平均识别率为81.4%,平均识别速率提高了29.37%。 展开更多
关键词 差分倒谱参数 动态时间规整(DTW) 声纹识别 梅尔系数(MFCC)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部