期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于智能语音的翻译机器人自动化控制系统设计
1
作者 杨维 秦波涛 《计算机测量与控制》 2024年第5期102-108,共7页
为提升自动控制效果,加快翻译速率,设计基于智能语音的翻译机器人自动化控制系统;采集外界智能语音信号,利用A/D转换器得到数字信号,启动语音唤醒模块激活翻译机器人,听写模式识别复杂语音信号,命令模式识别简单语音信号,得到语言文本... 为提升自动控制效果,加快翻译速率,设计基于智能语音的翻译机器人自动化控制系统;采集外界智能语音信号,利用A/D转换器得到数字信号,启动语音唤醒模块激活翻译机器人,听写模式识别复杂语音信号,命令模式识别简单语音信号,得到语言文本识别结果,通过深度学习关键词检测方法提取关键词作为翻译机器人的自动化控制指令,通过单片机识别自动化控制指令;实验结果表明,该系统可有效采集外界智能语音信号,在0.6 s至2 s之间时,该外界智能语音信号的振幅较小;系统运行时间最短为5.6 s,响应速度在11 m/s左右,控制误差最小为5.1%,BLEU值最高达到了42.75,控制准确率达到95.7%,提取智能语音信号的关键词,完成翻译机器人自动化控制。 展开更多
关键词 智能语音 翻译机器人 自动化控制 语音识别 最小分类错误 深度学习
下载PDF
Data-Driven Temporal Filtering on Teager Energy Time Trajectory for Robust Speech Recognition 被引量:1
2
作者 赵军辉 谢湘 匡镜明 《Journal of Beijing Institute of Technology》 EI CAS 2006年第2期195-200,共6页
Data-driven temporal filtering technique is integrated into the time trajectory of Teager energy operation (TEO) based feature parameter for improving the robustness of speech recognition system against noise. Three... Data-driven temporal filtering technique is integrated into the time trajectory of Teager energy operation (TEO) based feature parameter for improving the robustness of speech recognition system against noise. Three kinds of data-driven temporal filters are investigated for the motivation of alleviating the harmful effects that the environmental factors have on the speech. The filters include: principle component analysis (PCA) based filters, linear discriminant analysis (LDA) based filters and minimum classification error (MCE) based filters. Detailed comparative analysis among these temporal filtering approaches applied in Teager energy domain is presented. It is shown that while all of them can improve the recognition performance of the original TEO based feature parameter in adverse environment, MCE based temporal filtering can provide the lowest error rate as SNR decreases than any other algorithms. 展开更多
关键词 robust speech recognition principle component analysis linear discriminant analysis minimum classification error
下载PDF
一种基于最小误分率估计高斯混合模型参数的方法 被引量:2
3
作者 马继涌 高文 《计算机学报》 EI CSCD 北大核心 1999年第8期804-808,共5页
传统的基于最大似然估计高斯混合模型参数的方法是一种无导师的学习方法,该方法的主要缺点是学习算法在估计一类模式模型中的参数时只利用了该类模式中的训练样本,而未考虑其它类训练样本的分布影响,因此,这种方法的识别效果往往不... 传统的基于最大似然估计高斯混合模型参数的方法是一种无导师的学习方法,该方法的主要缺点是学习算法在估计一类模式模型中的参数时只利用了该类模式中的训练样本,而未考虑其它类训练样本的分布影响,因此,这种方法的识别效果往往不够理想.针对以上问题,作者提出利用最小误分率估计高斯混合模型参数的方法,这种方法考虑了不同类之间的样本的区分性.同时为了提高获得全局最优解的可能性,文中给出一种利用遗传规划求解最优参数的算法.这种方法用于非限定文本的话者识别.实验表明,该方法较传统的参数估计方法识别效果好. 展开更多
关键词 最小误分率 高斯混合模型 模式识别 语音识别
下载PDF
基于最小分类错误准则的判别学习方法 被引量:2
4
作者 韩纪庆 《电子工程师》 2001年第2期1-3,12,共4页
介绍了一种近年来正被广泛重视的模式识别方法——基于最小分类错误准则的判别学习方法 。
关键词 模式识别 最小分类错误 判别学习
下载PDF
面向行人重识别的跨视图最小分类误差二次判别分析方法
5
作者 江雨燕 董映宇 +2 位作者 郑炜晨 邵金 吕魏 《小型微型计算机系统》 CSCD 北大核心 2021年第10期2125-2130,共6页
行人重识别技术旨在匹配不同的摄像机拍摄场景中属于同一个人的所有图片.近年来,核化跨视图二次判别法已在相关任务中取得优良的效果.然而,在处理高维小样本数据时,对于协方差矩阵逆的估计通常由于数据集较小的原因容易产生较大的偏差;... 行人重识别技术旨在匹配不同的摄像机拍摄场景中属于同一个人的所有图片.近年来,核化跨视图二次判别法已在相关任务中取得优良的效果.然而,在处理高维小样本数据时,对于协方差矩阵逆的估计通常由于数据集较小的原因容易产生较大的偏差;在不同视图之间,人的外观经历复杂的非线性转换,因此导致识别精度较低.为解决此问题,本文提出一种将最小误差分类、平滑技术与核化跨视图二次判别法相结合的度量学习方法 MCE-kXQDA(minimum classification error-based kernel cross-view quadratic discriminant analysis),在非线性映射与跨视图二次判别法相结合的基础上将最小误差分类、平滑技术引入非线性维的核化空间中,实现非线性度量学习的同时有效提升协方差逆矩阵的估计精度.为验证MCE-kXQDA的有效性,我们在多个数据集上与其他相关方法进行了详细比较.实验结果表明MCE-kXQDA具有更优的识别精度和鲁棒性. 展开更多
关键词 行人重识别 度量学习 最小误差分类 跨视图二次判别法
下载PDF
Robust Speech Recognition Method Based on Discriminative Environment Feature Extraction 被引量:2
6
作者 韩纪庆 高文 《Journal of Computer Science & Technology》 SCIE EI CSCD 2001年第5期458-464,共7页
It is an effective approach to learn the influence of environmental parameters, such as additive noise and channel distortions, from training data for robust speech recognition. Most of the previous methods are based ... It is an effective approach to learn the influence of environmental parameters, such as additive noise and channel distortions, from training data for robust speech recognition. Most of the previous methods are based on maximum likelihood estimation criterion. However, these methods do not lead to a minimum error rate result. In this paper, a novel discrimina-tive learning method of environmental parameters, which is based on Minimum Classification Error (MCE) criterion, is proposed. In the method, a simple classifier and the Generalized Probabilistic Descent (GPD) algorithm are adopted to iteratively learn the environmental pa-rameters. Consequently, the clean speech features are estimated from the noisy speech features with the estimated environmental parameters, and then the estimations of clean speech features are utilized in the back-end HMM classifier. Experiments show that the best error rate reduction of 32.1% is obtained, tested on a task of 18 isolated confusion Korean words, relative to a conventional HMM system. 展开更多
关键词 robust speech recognition minimum classification error environmental parameter discriminative learning
原文传递
改进的KMSE方法及其实现 被引量:4
7
作者 徐勇 陆建峰 +1 位作者 金忠 杨静宇 《模式识别与人工智能》 EI CSCD 北大核心 2007年第3期394-398,共5页
依据 KMSE 模型对应的特征空间中的鉴别矢量可表示为部分训练样本的线性组合这一理论前提,可利用回归分析中变量选择的思路对 KMSE 模型加以改进.在本文中为了提高 KMSE 的分类效率而发展出的基于最小平方误差准则的算法能大大提升 KMSE... 依据 KMSE 模型对应的特征空间中的鉴别矢量可表示为部分训练样本的线性组合这一理论前提,可利用回归分析中变量选择的思路对 KMSE 模型加以改进.在本文中为了提高 KMSE 的分类效率而发展出的基于最小平方误差准则的算法能大大提升 KMSE 模型的分类速度.实验结果显示该算法还能取得较优的分类性能. 展开更多
关键词 核Fisher鉴别分析(KFDA) 核最小平方误差(KMSE) 鉴别矢量 模式识别
原文传递
Stream Weight Training Based on MCE for Audio-Visual LVCSR 被引量:1
8
作者 刘鹏 王作英 《Tsinghua Science and Technology》 SCIE EI CAS 2005年第2期141-144,共4页
In this paper we address the problem of audio-visual speech recognition in the framework of the multi-stream hidden Markov model. Stream weight training based on minimum classification error criterion is dis... In this paper we address the problem of audio-visual speech recognition in the framework of the multi-stream hidden Markov model. Stream weight training based on minimum classification error criterion is discussed for use in large vocabulary continuous speech recognition (LVCSR). We present the lattice re- scoring and Viterbi approaches for calculating the loss function of continuous speech. The experimental re- sults show that in the case of clean audio, the system performance can be improved by 36.1% in relative word error rate reduction when using state-based stream weights trained by a Viterbi approach, compared to an audio only speech recognition system. Further experimental results demonstrate that our audio-visual LVCSR system provides significant enhancement of robustness in noisy environments. 展开更多
关键词 audio-visual speech recognition (AVSR) large vocabulary continuous speech recognition (LVCSR) discriminative training minimum classification error (MCE)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部