期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
AN EFFECTIVE LVQ-BASED ALGORITHMFOR ROBUST SPEECH RECOGNITION
1
作者 朱策 关存太 +1 位作者 厉大华 何振亚 《Journal of Southeast University(English Edition)》 EI CAS 1994年第1期9-12,共4页
Dynamic time warping (DTW) and dynamic spectral wafliing (DSW)techniques are introduced into learning vector quantization (LVQ) algorithm to con-struct a “dynamic” Bayes classifier for speech recognition. It can pre... Dynamic time warping (DTW) and dynamic spectral wafliing (DSW)techniques are introduced into learning vector quantization (LVQ) algorithm to con-struct a “dynamic” Bayes classifier for speech recognition. It can preduce highly dis-criminiative “dynamic” reference vectors to represent the temporal and spectral vari-abilities of speech. Recognition experiments on 19 Chinese consonants show that the“dynamic” classifier outperforms the original “static” classifier significantly. 展开更多
关键词 speech recognition NEURAL networks algorithms/learning vectorquantization dynamic time warping dynamic spectral warping
下载PDF
基于MFCC提取和DTW优化的连续音频识别算法设计
2
作者 王鸿瑞 张玉辰 +2 位作者 陈鹭 高博韬 高昕悦 《中国现代教育装备》 2024年第17期41-45,52,共6页
介绍了一种新型的利用梅尔频率倒谱系数(MFCC)提取和动态时间规整技术(DTW)优化的连续音频识别算法。首先对数学原理与算法步骤进行设计与规划,使用大规模音频数据库进行预处理,经过时域和频域分析提取相应的特征;然后利用双门限法把连... 介绍了一种新型的利用梅尔频率倒谱系数(MFCC)提取和动态时间规整技术(DTW)优化的连续音频识别算法。首先对数学原理与算法步骤进行设计与规划,使用大规模音频数据库进行预处理,经过时域和频域分析提取相应的特征;然后利用双门限法把连续音频切分为不同的音频块,并对切分部分进行针对性识别,将其与时频域数据库的模板进行匹配比对,实现了较好的连续音频识别效果,在时域和频域识别上的准确性均能达到89%。该研究成果可应用于钢琴教学系统的开发,尤其是在辅助学习者正确弹出曲谱方面具有广阔的应用前景。 展开更多
关键词 语音识别 端点检测 梅尔频率倒谱系数 动态时间规整算法 时频域分析
下载PDF
基于动态时间规整的手势加速度信号识别 被引量:33
3
作者 荆雷 马文君 常丹华 《传感技术学报》 CAS CSCD 北大核心 2012年第1期72-76,共5页
为了提高基于加速度传感器的动态手势识别算法的性能,本文采用了动态时间规整(DTW)识别算法。通过该算法计算测试模板和参考模板的相似度,从而得出识别结果。为了验证该方法,建立了一套手势加速度无线采集系统,并采集了41个志愿者的手... 为了提高基于加速度传感器的动态手势识别算法的性能,本文采用了动态时间规整(DTW)识别算法。通过该算法计算测试模板和参考模板的相似度,从而得出识别结果。为了验证该方法,建立了一套手势加速度无线采集系统,并采集了41个志愿者的手势信息。实验结果表明,该方法手势平均识别率在97%以上。与HMM识别算法相比,DTW识别算法在识别的准确率上比HMM识别算法更具优势。 展开更多
关键词 手势识别 加速度传感器 动态时间规整 隐马尔科夫模型
下载PDF
基于手机手势识别的媒体控制界面 被引量:10
4
作者 丁跃 刘军发 +1 位作者 陈益强 周经野 《计算机工程》 CAS CSCD 北大核心 2010年第23期152-154,共3页
提出一种能够识别通过手机示意的自然手势、进而控制媒体播放的通用型人机界面。用户通过挥动个人的手机表达操作意图,由手机内置三轴加速度传感器获取相应的手势数据,采用动态时间弯曲等多种算法对用户的手势进行识别,实现对多媒体播... 提出一种能够识别通过手机示意的自然手势、进而控制媒体播放的通用型人机界面。用户通过挥动个人的手机表达操作意图,由手机内置三轴加速度传感器获取相应的手势数据,采用动态时间弯曲等多种算法对用户的手势进行识别,实现对多媒体播放的通用控制。实验结果表明,该界面对手机的几种通用手势均能获得较高的识别率,能在实际应用中对媒体进行简单、方便的控制。 展开更多
关键词 动态时间弯曲 隐马尔科夫模型 支持向量机 自然手势识别 人机交互 媒体播放界面
下载PDF
语音识别中动态时间规整和隐马尔可夫统一模型 被引量:5
5
作者 张焱 张杰 黄志同 《数据采集与处理》 CSCD 1997年第3期218-222,共5页
对于目前在语音识别中广泛使用的两种技术即动态时间规整(DTW)技术和隐马尔可夫模型(HMM)的本质联系,提出了二者的统一模型(DHUM,DTWandHMMUni-fiedModel),并分别给出DTW和HMM向DHUM的转换关系。文中还提出了用DHUM解决更接近... 对于目前在语音识别中广泛使用的两种技术即动态时间规整(DTW)技术和隐马尔可夫模型(HMM)的本质联系,提出了二者的统一模型(DHUM,DTWandHMMUni-fiedModel),并分别给出DTW和HMM向DHUM的转换关系。文中还提出了用DHUM解决更接近语音实际情况的高阶HMM作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明,建立在DHUM之上的识别器的识别性能不低于DTW和HMM识别器。 展开更多
关键词 语音识别 动态时间规整 隐马尔可夫模型
下载PDF
基于声纹识别的Web身份认证系统设计 被引量:5
6
作者 曾斌 姚路 陈志诚 《计算机工程》 CAS CSCD 北大核心 2011年第15期149-151,167,共4页
设计一个基于声纹识别的Web身份认证系统。在浏览器端利用自主开发的ActiveX录音控件录取封装使用者的声纹特征并传送给服务器,服务器端使用隐马尔科夫模型表述单字,单字之间通过增加静音状态分割以及语音训练形成稳定的声纹特征模型作... 设计一个基于声纹识别的Web身份认证系统。在浏览器端利用自主开发的ActiveX录音控件录取封装使用者的声纹特征并传送给服务器,服务器端使用隐马尔科夫模型表述单字,单字之间通过增加静音状态分割以及语音训练形成稳定的声纹特征模型作为身份验证的基础库。实际测试结果表明,该系统识别性能好、可移植性强,适用于网络资源的远程声控。 展开更多
关键词 身份认证 声纹识别 隐马尔科夫模型 动态时间校正
下载PDF
基于语音识别与特征的无监督语音模式提取 被引量:4
7
作者 张震 赵庆卫 颜永红 《计算机工程》 CAS CSCD 2014年第5期262-265,共4页
在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配... 在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。 展开更多
关键词 语音识别 语音模式发现 分段动态时间弯曲算法 图聚类算法 音素回环后验概率计算
下载PDF
一种基于定点DSP的语音识别算法实现 被引量:3
8
作者 吕涛 刘百芬 燕贤青 《华东交通大学学报》 2008年第6期68-72,共5页
介绍了一种基于定点DSP的特定人的孤立词语音识别系统,着重讨论了算法中参数快速提取的实现.该算法采用基于动态规划(DP)技术的动态时间弯折算法(DTW),采用VAD两极端点检测方案以提高端点检测的精度,以Mel尺度倒谱系数为语音识别参数.... 介绍了一种基于定点DSP的特定人的孤立词语音识别系统,着重讨论了算法中参数快速提取的实现.该算法采用基于动态规划(DP)技术的动态时间弯折算法(DTW),采用VAD两极端点检测方案以提高端点检测的精度,以Mel尺度倒谱系数为语音识别参数.首先讨论了标准浮点实现方法,然后结合算法特点和定点DSP的结构,采用了一种优化的快速定点实现方法.测试结果表明,定点算法时间比浮点算法大大降低,使系统的性能得到了提高. 展开更多
关键词 语音识别 动态时间弯折算法 Mel尺度倒谱系数 定点算法
下载PDF
基于离散隐马尔科夫模型的语音识别技术 被引量:3
9
作者 高清伦 谭月辉 王嘉祯 《河北省科学院学报》 CAS 2007年第2期8-11,共4页
概述语音识别技术的基本原理,对当前三种主要识别技术——动态时间规整技术、隐含马尔科夫模型技术及人工神经网络技术进行比较,重点介绍基于离散隐马尔科夫模型(DHMM)的语音识别系统的实现。
关键词 语音识别 隐马尔科夫模型 动态时间规整 人工神经网络
下载PDF
基于并行基因算法的语音识别方法 被引量:1
10
作者 贺前华 韦岗 徐秉铮 《华南理工大学学报(自然科学版)》 EI CAS CSCD 1996年第10期64-71,共8页
提出一种基于并行基因算法的孤立字识别时间规正算法,该算法是在[3]的基础上提出,可解决动态时间规划(DTW)难以解决的一些问题:①使距离归一化因子M与实际路径相关;②以自然方式提供多条最佳规划路径;③语音端点检测正... 提出一种基于并行基因算法的孤立字识别时间规正算法,该算法是在[3]的基础上提出,可解决动态时间规划(DTW)难以解决的一些问题:①使距离归一化因子M与实际路径相关;②以自然方式提供多条最佳规划路径;③语音端点检测正确性对识别率的影响得到一定程度的改善。建立了试验数据库,根据试验数据建立了模板距离遵循正态分布的算法性能分析模型。比较了并行基因算法,串行基因算法[3]和动态时间规划算法的性能。试验结果表明:基因算法比动态时间规划能得到更高的识别率,在单CPU情形下,虽然并行基因算法的性能比串行基因算法略微提高。 展开更多
关键词 基因算法 语音识别 动态时间规正 模式匹配
下载PDF
无端点检测汉语识别算法的实现及改进——动态时间规整和隐马尔可夫统一模型的应用 被引量:1
11
作者 张杰 黄志同 《声学技术》 CSCD 1998年第4期181-185,共5页
语音识别算法中,动态时间规整(DTW)和隐马尔可夫模型(HMM)是最有效的识别算法,并且两者之间有着本质的联系和内在的统一[1],据此前期工作中,已经建立了DTW和HMM的统一模型(DHUM)[2、3]。本文对DHU... 语音识别算法中,动态时间规整(DTW)和隐马尔可夫模型(HMM)是最有效的识别算法,并且两者之间有着本质的联系和内在的统一[1],据此前期工作中,已经建立了DTW和HMM的统一模型(DHUM)[2、3]。本文对DHUM进行了改进,在DHUM中引进寂静段自环,并根据汉语语音的特点,提出了一种无端点检测的语音识别算法。在识别过程中,该算法无需确定语音信号起止点位置,而是从寂静段开始,直接按帧提取特征(帧长20ms,帧间重叠50%),特征向量由15阶倒谱系数和帧平均能量组成。实验中,用DHUM实现了该算法,对99个相似汉语单字的识别测试结果表明:无端点检测的识别正识率为94.95%,正识率下降很少,但不作端点检测却降低了算法的复杂程度。为进一步改善识别性能,特征向量采用一种听觉模型特征,识别器具有更好的鲁棒性,识别率会略有提高。 展开更多
关键词 语音识别 隐马尔可夫模型 动态时间规整 汉语
下载PDF
基于基因算法的时间规正算法 被引量:1
12
作者 贺前华 韦岗 徐秉铮 《中文信息学报》 CSCD 1996年第1期31-45,共15页
本文提出了一种适用于孤立字识别的基于基因算法的时间规正算法;详细讨论了其中一些关键技术,如编码方法、适应度技术、基因操作子设计等。该算法可弥补动态时间规划(DTW)的某些不足:(1)使距离归一化因子MΦ与实际路径相关... 本文提出了一种适用于孤立字识别的基于基因算法的时间规正算法;详细讨论了其中一些关键技术,如编码方法、适应度技术、基因操作子设计等。该算法可弥补动态时间规划(DTW)的某些不足:(1)使距离归一化因子MΦ与实际路径相关,这使不同路径的比较更合理;(2)以自然方式提供多条最佳规划路径。建立了试验数据库,在试验结果的基础上提出了算法性能分析模型:模板间距离遵循正态分布.通过与DTW及串行多路径搜索法的性能进行比较,结果表明基因时间规正算法具有明显的识别优势。 展开更多
关键词 语音识别 基因算法 时间规正算法 参考模板
下载PDF
改进的高效动态时间规整算法语音识别系统 被引量:1
13
作者 王新胜 巩捷甫 喻明艳 《太赫兹科学与电子信息学报》 2015年第6期942-946,共5页
动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法... 动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。 展开更多
关键词 语音识别 动态时间规整 隐马尔可夫
下载PDF
语音识别中广义模型及其算法收敛性分析
14
作者 张杰 余志刚 黄志同 《计算机工程与应用》 CSCD 北大核心 2000年第2期60-62,共3页
语音识别中,动态时间规整和隐马尔可夫划最有效的两种识别算法,并且DTW和HMM在本质上是一致的。根据DTW和HMM的本质联系和各自所对应的声学模型,在前期工作中建立了一种广义声学模型,并指出DTW和HMM只是GM的特... 语音识别中,动态时间规整和隐马尔可夫划最有效的两种识别算法,并且DTW和HMM在本质上是一致的。根据DTW和HMM的本质联系和各自所对应的声学模型,在前期工作中建立了一种广义声学模型,并指出DTW和HMM只是GM的特例,且DTW和HMM都可以转化为GM。 展开更多
关键词 语音识别 Fisher算法 广义模型 算法收敛性
下载PDF
基于动态时间规整和隐马尔可夫统一模型的无端点检测的汉语识别算法
15
作者 张杰 张焱 黄志同 《数据采集与处理》 CSCD 1998年第3期220-223,共4页
根据汉语语音的特点,提出了一种无端点检测的语音识别算法。在识别过程中,该算法无需确定语音信号起止点位置,而是从寂静段开始,直接按帧提取特征(帧长20ms,帧间重叠50%),特征向量由15阶倒谱系数和帧平均能量组成。在... 根据汉语语音的特点,提出了一种无端点检测的语音识别算法。在识别过程中,该算法无需确定语音信号起止点位置,而是从寂静段开始,直接按帧提取特征(帧长20ms,帧间重叠50%),特征向量由15阶倒谱系数和帧平均能量组成。在动态时间规整(DTW)和隐马尔可夫(HMM)统一模型(DHUM)中,引进寂静段自环,并用DHUM实现了该算法。对99个相似汉语单字的识别实验表明:无端点检测的识别器正识率为94.95%,正识率下降很少,但不作端点检测却降低了算法的复杂程度。该算法中,若特征向量采用一种听觉模型特征,识别器具有更好的鲁棒性,识别率会略有提高。 展开更多
关键词 语音识别 端点检测 汉语语音 隐马尔可夫模型
下载PDF
声控机器人的特定人孤立词汉语识别系统设计
16
作者 何燕玲 马建国 《西南科技大学学报》 CAS 2006年第1期35-38,共4页
利用语音命令对机器人的行动控制,有很大的实用价值。介绍了采用动态时间弯折(DTW,Dynamic Time Warping)算法进行模式匹配的特定人孤立词汉语识别系统。DTW算法简单有效,尤其适合孤立词语识别系统。用凌阳单片机SPCE061A搭建的机器人... 利用语音命令对机器人的行动控制,有很大的实用价值。介绍了采用动态时间弯折(DTW,Dynamic Time Warping)算法进行模式匹配的特定人孤立词汉语识别系统。DTW算法简单有效,尤其适合孤立词语识别系统。用凌阳单片机SPCE061A搭建的机器人平台对系统进行测试,结果表明,系统识别效果良好,控制者通过语音可以实时控制机器人行动。 展开更多
关键词 语音识别 动态时间弯折算法 特定人 孤立词
下载PDF
基于震动信号的异常步态识别
17
作者 汪成亮 刘艺锣 《电子学报》 EI CAS CSCD 北大核心 2023年第8期2088-2097,共10页
异常步态的识别对老年人的健康看护有很大帮助.现有的相关研究主要通过图像采集设备或穿戴设备获取相关特征信息进行识别,这些方法大多都具有侵入性或对用户有较高的操作要求.本文研究实现了一种基于对脚步震动信号为识别源进行异常步... 异常步态的识别对老年人的健康看护有很大帮助.现有的相关研究主要通过图像采集设备或穿戴设备获取相关特征信息进行识别,这些方法大多都具有侵入性或对用户有较高的操作要求.本文研究实现了一种基于对脚步震动信号为识别源进行异常步态和跌倒检测的系统原型,该系统通过本文设计的应用于大范围数据采集的多传感器协同信号采集方法采集信号,从中分割出有效部分作为活动元,去噪后再使用改进的动态时间规整算法(Dynamic Time Warping,DTW)计算出代表活动元之间差异性的异常指数,接着由K最近邻(K-Nearest Neighbor,KNN)算法分类异常指数,得到初步表征用户步态的推测值,最后由隐马尔科夫模型(Hidden Markov Model,HMM)进一步处理推测值,识别出用户的步态.实验结果表明,本文提出的方法能够有效在不同的步态模式下识别异常步态,在稳定的环境中识别准确率达到96%,在具有不稳定地板的环境中准确率为94%. 展开更多
关键词 异常步态识别 动态时间规整算法 隐马尔科夫模型 震动信号 嵌入式设备
下载PDF
基于DTW与混合判别特征检测器的手势识别 被引量:7
18
作者 黄振翔 彭波 +1 位作者 吴娟 王儒朋 《计算机工程》 CAS CSCD 2014年第5期216-218,223,共4页
在动态手势识别领域,动态时间规整(DTW)算法在消除不同时空表示模式之间的时间差异方面具有优势,但作为一种模板匹配算法,受限于样本库的容量大小并且缺乏统计模型框架训练,其识别效果和稳定性较差,尤其在大数据量、复杂手势和组合手势... 在动态手势识别领域,动态时间规整(DTW)算法在消除不同时空表示模式之间的时间差异方面具有优势,但作为一种模板匹配算法,受限于样本库的容量大小并且缺乏统计模型框架训练,其识别效果和稳定性较差,尤其在大数据量、复杂手势和组合手势的情况下。针对上述不足,提出一种基于DTW和混合判别特征检测器(CFDF)的手势识别算法。利用DTW只对手势信号在时域进行规整,通过CFDF将手势特征的概率分布转换成二值的分段线性函数,根据允许的偏差范围分别做归0或归1处理后,再进行二次分类。实验结果表明,该算法通过舍弃无辨识度特征有效地降低了维度和噪声,手势平均识别率可达91.2%,比单独采用DTW的识别算法提高了6.0%。 展开更多
关键词 手势识别 动态时间规整 隐马尔可夫模型 归一化 统计模型 混合判别特征检测器
下载PDF
面向聋儿的计算机言语训练方法及其实现 被引量:4
19
作者 刘华东 吴玺宏 迟惠生 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第3期444-450,共7页
将语音信号处理和语音识别技术应用于聋儿言语训练中 ,设计并实现了一个适合聋儿使用的言语康复训练系统。根据聋儿言语训练的特点以及语音的声学特征和生理特征的关系 ,基于语音特征视觉反馈的训练方式 ,提出了目标训练法和对比训练法... 将语音信号处理和语音识别技术应用于聋儿言语训练中 ,设计并实现了一个适合聋儿使用的言语康复训练系统。根据聋儿言语训练的特点以及语音的声学特征和生理特征的关系 ,基于语音特征视觉反馈的训练方式 ,提出了目标训练法和对比训练法。针对聋儿的发音异常和构音异常 ,设计了从基础训练、构音训练到清晰度训练的计算机言语辅助训练模块。该系统在中国聋儿康复研究中心进行了初步临床实验 ,在中班和大班聋儿的训练上取得较好效果。 展开更多
关键词 计算机言语辅助训练系统 动态时间规整 自动发音评分 隐马尔可夫模型
下载PDF
嵌入式语音识别系统中的DTW在线并行算法 被引量:5
20
作者 姜干新 陈伟 《计算机应用研究》 CSCD 北大核心 2010年第3期977-980,共4页
为提高语音识别系统的实时性,利用动态规划和并行计算思想,提出一种适用于嵌入式语音识别系统的DTW(动态时间规整)在线并行算法。通过分析标准DTW及其主要衍生算法,对DTW算法的数据结构进行改进以满足在线算法要求,在寻找最佳路径过程... 为提高语音识别系统的实时性,利用动态规划和并行计算思想,提出一种适用于嵌入式语音识别系统的DTW(动态时间规整)在线并行算法。通过分析标准DTW及其主要衍生算法,对DTW算法的数据结构进行改进以满足在线算法要求,在寻找最佳路径过程中动态连续地分配和释放内存或预先分配固定大小的内存,并将多个关键词的DTW计算分布到多个运算单元;最后汇总各运算单元的结果得到识别结果。实验表明,该算法比经典DTW降低了内存使用和识别时间,并使语音识别的实时系数达到1.17,具有较高的实时性。 展开更多
关键词 语音识别 动态时间规整 在线算法 并行算法 嵌入式系统
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部