期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
Discriminative tonal feature extraction method in mandarin speech recognition 被引量:1
1
作者 HUANG Hao ZHU Jie 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2007年第4期126-130,共5页
To utilize the supra-segmental nature of Mandarin tones, this article proposes a feature extraction method for hidden markov model (HMM) based tone modeling. The method uses linear transforms to project Fo(fundamen... To utilize the supra-segmental nature of Mandarin tones, this article proposes a feature extraction method for hidden markov model (HMM) based tone modeling. The method uses linear transforms to project Fo(fundamental frequency) features of neighboring syllables as compensations, and adds them to the original Fo features of the current syUable. The transforms are discriminatively trained by using an objective function termed as "minimum tone error", which is a smooth approximation of tone recognition accuracy. Experiments show that the new tonal features achieve 3.82% tone recognition rate improvement, compared with the baseline, using maximum likelihood trained HMM on the normal F0 features. Further experiments show that discriminative HMM training on the new features is 8.78% better than the baseline. 展开更多
关键词 discriminative training tone recognition feature extraction Mandarin speech recognition
原文传递
面向变电站智能运检的声音谱特征语音识别方法 被引量:2
2
作者 高宝明 孙国繁 +3 位作者 冯俊杰 段雨松 刘霄 杨爱民 《高压电器》 CAS CSCD 北大核心 2023年第11期40-47,共8页
语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱... 语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱的特征参数,通过对参数分布的估计,能够有效地降低语音信息中的噪声干扰。为提升语音识别性能,文中设计一个端到端的语音识别模型。该模型基于卷积神经网络(CNN),并融合了CTC和注意力机制。CNN网络能够有效地捕捉语音数据中的局部模式和结构信息,而CTC和注意力机制在解码过程中起到关键作用。文中使用Aurora、Aishell以及运检语音数据集进行了实验评估,比较了语音降噪、语音识别同传统方法的效果。实验结果表明,所提出的语音识别模型取得了显著的性能提升,可为相关领域的研究和应用提供有价值的参考。 展开更多
关键词 智能运检 语音识别 声音谱特性 分布估计 卷积神经网络
下载PDF
基音周期估计算法在声调康复训练中的应用 被引量:6
3
作者 李仕萍 闵锐 +3 位作者 钟金钢 凌卫新 狄红卫 陈卓铭 《计算机工程与应用》 CSCD 北大核心 2003年第31期198-200,共3页
汉语是一种声调语言,而声调的识别是以基音周期的估计为基础的。文章首先用LPC求残差系数,然后对残差系数求自相关周期,进而求出基音周期,再结合计算机智能诊断,提出了一套适合临床语言障碍患者进行语音诊断和康复训练的方法。
关键词 基音周期估计 语音声调 自相关 康复训练
下载PDF
在汉语语音识别中应用声调信息的研究 被引量:5
4
作者 乔春雷 吴及 王作英 《计算机工程与应用》 CSCD 北大核心 2002年第12期51-53,共3页
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好... 声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。 展开更多
关键词 基音提取 声调特征 汉语语音识别 声调信息
下载PDF
基于MCE准则的语音识别特征线性判别分析 被引量:4
5
作者 陈斌 张连海 +2 位作者 牛铜 屈丹 李弼程 《自动化学报》 EI CSCD 北大核心 2014年第6期1208-1215,共8页
提出了一种基于最小分类错误(Minimum classification error,MCE)准则的线性判别分析方法(Linear discriminant analysis,LDA),并将其应用到连续语音识别中的特征变换.该方法采用非参数核密度估计方法进行数据概率分布估计;根据得到的... 提出了一种基于最小分类错误(Minimum classification error,MCE)准则的线性判别分析方法(Linear discriminant analysis,LDA),并将其应用到连续语音识别中的特征变换.该方法采用非参数核密度估计方法进行数据概率分布估计;根据得到的概率分布,在最小分类错误准则下,采用基于梯度下降的线性搜索算法求解判别分析变换矩阵.利用判别分析变换矩阵对相邻帧梅尔滤波器组输出拼接的超矢量变换降维,得到时频特征.实验结果表明,与传统的MFCC特征相比,经过本文判别分析提取的时频特征其识别准确率提高了1.41%,相比于HLDA(Heteroscedastic LDA)和近似成对经验正确率准则(Approximate pairwise empirical accuracy criterion,aPEAC)判别分析方法,识别准确率分别提高了1.14%和0.83%. 展开更多
关键词 线性判别分析 语音识别 核密度估计 特征变换
下载PDF
汉语连续语音中声调识别的特殊性研究 被引量:2
6
作者 钟金宏 杨善林 蒋俊杰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期470-473,共4页
大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若... 大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若干结论 。 展开更多
关键词 声调识别 基音检测 语音分割 声调模式 汉语连续语音 特殊性 语音识别
下载PDF
汉语语音识别中的区分性声调建模方法 被引量:4
7
作者 黄浩 朱杰 哈力旦 《计算机工程与应用》 CSCD 北大核心 2009年第11期178-182,共5页
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的... 提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。 展开更多
关键词 区分性训练 声调建模 汉语语音识别 特征提取
下载PDF
基于子波方差和尺度波长关系的语音识别算法研究 被引量:3
8
作者 陈理 杨雪梅 +1 位作者 毕春艳 陈莹莹 《现代电子技术》 北大核心 2018年第10期169-171,共3页
为了提高语音识别的精确度,提出一种将子波方差分析手段应用于基音检测的改进基音检测算法。该算法选用Daubechies子波把信号分解到适当尺度,然后再利用墨西哥帽子波进行子波方差分析;结合子波尺度与波长关系,能够精确地定位基音周期的... 为了提高语音识别的精确度,提出一种将子波方差分析手段应用于基音检测的改进基音检测算法。该算法选用Daubechies子波把信号分解到适当尺度,然后再利用墨西哥帽子波进行子波方差分析;结合子波尺度与波长关系,能够精确地定位基音周期的数值。将其应用于汉语声调的检测中,仿真结果表明,该算法可以根据实际要求调整扫描尺度的精度和范围,具有可调节性。 展开更多
关键词 子波方差 尺度波长 子波能量 基音检测 声调识别 语音识别算法
下载PDF
基于发音特征的汉语声调建模方法及其在汉语语音识别中的应用 被引量:2
9
作者 晁浩 杨占磊 刘文举 《计算机应用》 CSCD 北大核心 2013年第10期2939-2944,共6页
发音特征表征了语音的发音方式信息,能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上,将发音方式划分为19类,并提出利用阶层式多层感知器计算语音信号属于各类的后验概率,作为发音特征。之后,将发音特征... 发音特征表征了语音的发音方式信息,能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上,将发音方式划分为19类,并提出利用阶层式多层感知器计算语音信号属于各类的后验概率,作为发音特征。之后,将发音特征与传统的韵律特征一起用于声调建模。实验结果显示,加入发音特征后,在三种不同的建模方法下声调识别的准确率提升约5%。将声调模型融入大词表连续语音识别系统后,汉字错误率有了明显的下降。 展开更多
关键词 语音识别 声调建模 发音特征 阶层式多层感知机分类器
下载PDF
四声模糊识别方法 被引量:12
10
作者 徐士林 《电子学报》 EI CAS CSCD 北大核心 1996年第1期119-121,共3页
本文给出一种快速模糊声调识别方法。用一电平削波、降低采样率和线性插值等形成快速基音提取。应用模糊集合理论,构成隶属函数对四声进行模式分类。方法具有简便、可靠、快速实时性和容差性等特点。
关键词 声调识别 语音识别 基音提取
下载PDF
基于矢量泰勒级数的鲁棒语音识别 被引量:4
11
作者 吕勇 吴镇扬 《天津大学学报》 EI CAS CSCD 北大核心 2011年第3期261-265,共5页
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混... 矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法. 展开更多
关键词 特征补偿 矢量泰勒级数 噪声估计 鲁棒语音识别
下载PDF
语音识别中基于发音特征的声调集成算法 被引量:2
12
作者 晁浩 宋成 刘志中 《计算机工程与应用》 CSCD 2014年第23期21-25,共5页
提出基于发音特征的声调建模改进方法,并将其用于随机段模型的一遍解码中。根据普通话的发音特点,确定了用于区别汉语元音、辅音信息的7种发音特征,并以此为目标值利用阶层式多层感知器计算语音信号属于发音特征的35个类别后验概率,将... 提出基于发音特征的声调建模改进方法,并将其用于随机段模型的一遍解码中。根据普通话的发音特点,确定了用于区别汉语元音、辅音信息的7种发音特征,并以此为目标值利用阶层式多层感知器计算语音信号属于发音特征的35个类别后验概率,将该概率作为发音特征与传统的韵律特征一起用于声调建模。根据随机段模型的解码特点,在两层剪枝后对保留下来的路径计算其声调模型概率得分,加权后加入路径总的概率得分中。在"863-test"测试集上进行的实验结果显示,使用了新的发音特征集合中声调模型的识别精度提高了3.11%;融入声调信息后随机段模型的字错误率从13.67%下降到12.74%。表明了将声调信息应用到随机段模型的可行性。 展开更多
关键词 语音识别 随机段模型 声调建模 发音特征 阶层式多层感知器
下载PDF
基于子带信息的鲁棒语音特征提取框架 被引量:3
13
作者 张欣研 王帆 +2 位作者 郑方 徐明星 吴文虎 《中文信息学报》 CSCD 北大核心 2002年第1期19-24,共6页
本文提出一种鲁棒语音特征提取框架。通过使用一种基于子带能量分布的噪声估计方法 ,无需静音段 ,就可以估计出带噪语音的子带噪声 ,同时提出结合谱减和谱加权方法对特征进行处理 ,最终生成具有较高鲁棒性的特征实验证明 ,在语音识别系... 本文提出一种鲁棒语音特征提取框架。通过使用一种基于子带能量分布的噪声估计方法 ,无需静音段 ,就可以估计出带噪语音的子带噪声 ,同时提出结合谱减和谱加权方法对特征进行处理 ,最终生成具有较高鲁棒性的特征实验证明 ,在语音识别系统中 ,这种特征可以有效提高语音识别的鲁棒性 ,在噪声较强 (信噪比 0dB到15dB)的情况下 ,识别率可以提高 2 0 %以上 ;并且 ,在干净语音的情况下又能保证识别率没有大的下降 ;同时 ,这种特征上的处理方法对各种噪声的适应能力都很强 。 展开更多
关键词 语言识别 噪声估计 鲁棒语音特征 语音识别系统
下载PDF
基于小波分析的汉语语音识别 被引量:5
14
作者 许开宇 张曙 《哈尔滨工程大学学报》 EI CAS CSCD 1996年第4期20-26,共7页
将小波分析这一崭新的理论工具应用于汉语语音识别中。
关键词 小波分析 小波变换 汉语 特征提取 语音识别
下载PDF
基于基频特征的情感语音识别研究 被引量:2
15
作者 郭鹏娟 蒋冬梅 +1 位作者 Hichem Sahli Werner Verhelst 《计算机应用研究》 CSCD 北大核心 2007年第10期101-103,共3页
探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,... 探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,获得了较好的结果。 展开更多
关键词 语音信号 基频 情感特征 情感识别
下载PDF
汉语第零声的声调特征研究 被引量:1
16
作者 马占武 王炳锡 《电声技术》 2005年第7期45-47,共3页
汉语普通话是一种带声调的语言,声调信息在汉语连续语音识别中具有非常重要的作用。传统的连续语音声调识别算法一般只研究阴平、阳平、上声、去声的声调特征,却很少讨论第零声(即轻声)的声调特征。利用归一化自相关函数法研究了轻声音... 汉语普通话是一种带声调的语言,声调信息在汉语连续语音识别中具有非常重要的作用。传统的连续语音声调识别算法一般只研究阴平、阳平、上声、去声的声调特征,却很少讨论第零声(即轻声)的声调特征。利用归一化自相关函数法研究了轻声音节基频轨迹的特点,并给出了可用于识别轻声音节的一些基本声调特征。 展开更多
关键词 声调识别 轻声 特征提取 语音识别
下载PDF
语音信号特征参数的分析和选取 被引量:2
17
作者 李亭亭 邓丽 +1 位作者 许博 段从武 《信息与电脑》 2018年第5期45-46,49,共3页
在与文本有关的说话人识别系统中,既需要识别说话人的身份,又需要识别语音文本的内容。语音信号特征参数的选取对系统来说至关重要。目前,在传统语音识别系统的研究中,主要采用MFCC参数作为特征参数进行识别。笔者对语音信号特征参数进... 在与文本有关的说话人识别系统中,既需要识别说话人的身份,又需要识别语音文本的内容。语音信号特征参数的选取对系统来说至关重要。目前,在传统语音识别系统的研究中,主要采用MFCC参数作为特征参数进行识别。笔者对语音信号特征参数进行分析,对不同的语音特征参数组合进行实验。实验结果证明,在该系统中,MFCC参数与基音参数的组合提高了系统的识别率。 展开更多
关键词 说话人识别技术 语音特征参数 MFCC 基音周期
下载PDF
汉语声调识别中的基音后处理方法
18
作者 周韡 梁维谦 刘润生 《桂林电子科技大学学报》 2008年第3期214-218,共5页
汉语是一种带有声调的语言,声调信息主要体现在韵母的基音轨迹中,但是由于提取的基音不够稳健,所以必须要对基音进行后处理。通过归纳以帧为单位和以韵母为单位的两类基音后处理方式,并在第一种方式中提出基于韵母平均值进行归一化算法... 汉语是一种带有声调的语言,声调信息主要体现在韵母的基音轨迹中,但是由于提取的基音不够稳健,所以必须要对基音进行后处理。通过归纳以帧为单位和以韵母为单位的两类基音后处理方式,并在第一种方式中提出基于韵母平均值进行归一化算法,在第二种方式中提出了帧叠靠前和帧叠靠后的韵母四等分长算法,经实验结果(以标准HTK为平台)得出后者更优的结论。考虑到前后声调的影响,采用声调三音子模型进行声调识别测试,可以比单音子模型识别效果提高10%左右。 展开更多
关键词 语音识别 声调识别 基音后处理 帧叠靠前/帧叠靠后四等分均值算法 声调三音子模型
下载PDF
汉语语音声调提取技术方法研究
19
作者 李源 周莹 《现代电子技术》 2012年第7期64-66,共3页
随着现代科技和计算机以及平板电脑等的发展,语音交互将成为人机通信的主要方式,而汉语在语音合成中声调是不可或缺的一个重要组成部分。在声调提取过程中首先采用改进的短时自相关函数的方法进行基音检测,同时为了能较为精确地进行浊... 随着现代科技和计算机以及平板电脑等的发展,语音交互将成为人机通信的主要方式,而汉语在语音合成中声调是不可或缺的一个重要组成部分。在声调提取过程中首先采用改进的短时自相关函数的方法进行基音检测,同时为了能较为精确地进行浊音的基音检测,利用变长分帧的方法提取基音周期序列,并通过Matlab仿真得到了汉语语音4种声调的调型曲线。仿真结果表明,该方法所得到的调型曲线与汉语普通话声调的典型曲线较为一致。 展开更多
关键词 基音周期 基音检测 声调提取 语音合成
下载PDF
基于MFCC的频谱重构实现音高估计和发声分类
20
作者 张少华 秦会斌 《测控技术》 2019年第11期86-89,131,共5页
音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进... 音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。 展开更多
关键词 语音识别 音高估计 梅尔频率倒谱系数 高斯混合模型
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部