期刊文献+
共找到141篇文章
< 1 2 8 >
每页显示 20 50 100
Adaptive bands filter bank optimized by genetic algorithm for robust speech recognition system 被引量:5
1
作者 黄丽霞 G.Evangelista 张雪英 《Journal of Central South University》 SCIE EI CAS 2011年第5期1595-1601,共7页
Perceptual auditory filter banks such as Bark-scale filter bank are widely used as front-end processing in speech recognition systems.However,the problem of the design of optimized filter banks that provide higher acc... Perceptual auditory filter banks such as Bark-scale filter bank are widely used as front-end processing in speech recognition systems.However,the problem of the design of optimized filter banks that provide higher accuracy in recognition tasks is still open.Owing to spectral analysis in feature extraction,an adaptive bands filter bank (ABFB) is presented.The design adopts flexible bandwidths and center frequencies for the frequency responses of the filters and utilizes genetic algorithm (GA) to optimize the design parameters.The optimization process is realized by combining the front-end filter bank with the back-end recognition network in the performance evaluation loop.The deployment of ABFB together with zero-crossing peak amplitude (ZCPA) feature as a front process for radial basis function (RBF) system shows significant improvement in robustness compared with the Bark-scale filter bank.In ABFB,several sub-bands are still more concentrated toward lower frequency but their exact locations are determined by the performance rather than the perceptual criteria.For the ease of optimization,only symmetrical bands are considered here,which still provide satisfactory results. 展开更多
关键词 perceptual filter banks bark scale speaker independent speech recognition systems zero-crossing peak amplitude genetic algorithm
下载PDF
Face Recognition Based on Gabor Feature Extraction Followed by FastICA and LDA 被引量:1
2
作者 Masoud Muhammed Hassan Haval Ismael Hussein +1 位作者 Adel Sabry Eesa Ramadhan J.Mstafa 《Computers, Materials & Continua》 SCIE EI 2021年第8期1637-1659,共23页
Over the past few decades,face recognition has become the most effective biometric technique in recognizing people’s identity,as it is widely used in many areas of our daily lives.However,it is a challenging techniqu... Over the past few decades,face recognition has become the most effective biometric technique in recognizing people’s identity,as it is widely used in many areas of our daily lives.However,it is a challenging technique since facial images vary in rotations,expressions,and illuminations.To minimize the impact of these challenges,exploiting information from various feature extraction methods is recommended since one of the most critical tasks in face recognition system is the extraction of facial features.Therefore,this paper presents a new approach to face recognition based on the fusion of Gabor-based feature extraction,Fast Independent Component Analysis(FastICA),and Linear Discriminant Analysis(LDA).In the presented method,first,face images are transformed to grayscale and resized to have a uniform size.After that,facial features are extracted from the aligned face image using Gabor,FastICA,and LDA methods.Finally,the nearest distance classifier is utilized to recognize the identity of the individuals.Here,the performance of six distance classifiers,namely Euclidean,Cosine,Bray-Curtis,Mahalanobis,Correlation,and Manhattan,are investigated.Experimental results revealed that the presented method attains a higher rank-one recognition rate compared to the recent approaches in the literature on four benchmarked face datasets:ORL,GT,FEI,and Yale.Moreover,it showed that the proposed method not only helps in better extracting the features but also in improving the overall efficiency of the facial recognition system. 展开更多
关键词 Artificial intelligence face recognition FASTICA Gabor filter bank LDA
下载PDF
Auditory-Spectrum Quantization Based Speech Recognition
3
作者 WuYuanqing HaoJie 《通信学报》 EI CSCD 北大核心 1997年第3期26-34,共9页
Auditory┐SpectrumQuantizationBasedSpeechRecognitionWuYuanqingHaoJieLuDajinLiXingZhuXuelong(DepartmentofElect... Auditory┐SpectrumQuantizationBasedSpeechRecognitionWuYuanqingHaoJieLuDajinLiXingZhuXuelong(DepartmentofElectronicEngineering,... 展开更多
关键词 语音识别 电磁波谱 量化 自适应滤波器
下载PDF
基于PSD特征的FBCCA脑电信号识别方法 被引量:1
4
作者 张学军 杨京儒 《科学技术与工程》 北大核心 2024年第4期1411-1417,共7页
当前基于稳态视觉诱发电位(steady-state visual evoked potential,SSVEP)的脑机接口(brain-computer interfaces,BCIs)使用的都是单一识别算法,针对不同时间长度的识别准确率较低。提出了一种基于滤波器组的典型相关分析(filter bank c... 当前基于稳态视觉诱发电位(steady-state visual evoked potential,SSVEP)的脑机接口(brain-computer interfaces,BCIs)使用的都是单一识别算法,针对不同时间长度的识别准确率较低。提出了一种基于滤波器组的典型相关分析(filter bank canonical correlation analysis,FBCCA)与功率谱密度(power spectral density,PSD)分析相结合的SSVEP识别算法,可以提高SSVEP识别的普适性与准确率。该方法使用FBCCA寻找高相似度的参考频率信号,再通过多组PSD分析来锁定最终的响应频率,完成频率识别。该方法无需经过训练就能得到较高的识别准确率。实验结果表明:在刺激时长为1 s时,该方法能达到86.61%的准确率,比PSD分析方法提升了5.44%,比典型相关性分析方法(canonical correlation analysis,CCA)提升了10.38%的准确率,比FBCCA提升了8.86%的准确率。 展开更多
关键词 脑机接口(BCI) 稳态视觉诱发电位(SSVEP) 滤波器组的典型相关分析(FBCCA) 功率谱密度(PSD) 频率识别
下载PDF
高职农产品加工与质量检测专业学分银行模式下学分认定与转换细则研究
5
作者 李俐鑫 孙强 +1 位作者 孙洁心 唐民民 《黑龙江生态工程职业学院学报》 2024年第4期102-105,共4页
学分银行是当前高等职业教育中十分重要的管理模式,如何进行学习成果认证及学分转换是学分银行建设中需要解决的重点问题。本研究旨在探讨学分银行模式下学生课外学习成果的认证和转换问题,通过查阅国家专业标准和行业标准、实地走访企... 学分银行是当前高等职业教育中十分重要的管理模式,如何进行学习成果认证及学分转换是学分银行建设中需要解决的重点问题。本研究旨在探讨学分银行模式下学生课外学习成果的认证和转换问题,通过查阅国家专业标准和行业标准、实地走访企业等多种方式进行研究,制定了黑龙江省农产品加工与质量检测专业专科学分认定和转换细则,为学分银行在高职农产品加工与质量检测专业中的应用实践奠定了基础。 展开更多
关键词 农产品加工与质量检测 学分银行 学习成果 学分认定 学分转换
下载PDF
基于LFBank与FBank混合特征的声纹识别研究 被引量:3
6
作者 崔琳 王芷悦 《计算机科学》 CSCD 北大核心 2022年第S02期621-625,共5页
语音特征提取是声纹识别过程中的重要步骤,对于声音频率的分布男性与女性差距较大,但现有的特征提取算法并没有针对不同性别声音频率特性做出相应改进。针对上述问题,提出了为女性声纹识别所设计的语音特征提取算法LFBank,将线性滤波器... 语音特征提取是声纹识别过程中的重要步骤,对于声音频率的分布男性与女性差距较大,但现有的特征提取算法并没有针对不同性别声音频率特性做出相应改进。针对上述问题,提出了为女性声纹识别所设计的语音特征提取算法LFBank,将线性滤波器组用于特征提取过程,利用其线性分布的特点弥补传统梅尔滤波器组提取高频区域信息时的不足。另一方面,为了突破单一性别局限,拓宽应用场景,综合线性滤波器组与梅尔滤波器组的优势,将LFBank与FBank特征结合得到混合特征向量进行声纹识别。将LFBank和常用特征FBank与MFCC进行实验对比,实验结果表明,基于线性滤波器组的特征向量在识别女性声音时更有优势。对于混合特征而言,在与单一特征的对比实验中,混合特征能够达到比单一特征更好的识别效果,具有更广泛的应用场景。 展开更多
关键词 声纹识别 特征提取 声音频率 线性滤波器组 梅尔滤波器组 混合特征
下载PDF
基于系统论的学分银行学分互认机制研究
7
作者 刘刚 《山西开放大学学报》 2024年第3期59-62,共4页
学分银行学分互认机制的形成是一个系统工程。目前,我国学分银行学分互认体系存在学分银行建设和发展不平衡、学习成果互认困难、学分互认相关各方参与度不够、学分互认实践应用有限等问题。运用系统论的思想,科学分析经济、社会、科技... 学分银行学分互认机制的形成是一个系统工程。目前,我国学分银行学分互认体系存在学分银行建设和发展不平衡、学习成果互认困难、学分互认相关各方参与度不够、学分互认实践应用有限等问题。运用系统论的思想,科学分析经济、社会、科技、教育等学分互认系统外部环境,学习者、学校、行业企业、培训机构、社区(老年)学院等内部构成要素,以及学分互认体系运行。提出加强学分互认横向、纵向系统管理,提升相关方参与学分互认的积极性,完善学分互认标准等措施,优化我国学分银行学分互认体系。 展开更多
关键词 学分银行 学分互认 系统论
下载PDF
继续教育视阈下国内两种不同类型学分银行实践对象的比较研究——以会计学专业为例
8
作者 何湘虹 《考试研究》 2024年第5期58-66,共9页
学分银行制度是将不同类型的学习成果进行量化、衡量、储存、转换,转换过程及结果得到社会认可的一种管理制度。从国家教育规划而言,建设学分银行制度是长期目标和战略任务,属于建设学习型社会的重要内容;从社会实践而言,学分银行是激... 学分银行制度是将不同类型的学习成果进行量化、衡量、储存、转换,转换过程及结果得到社会认可的一种管理制度。从国家教育规划而言,建设学分银行制度是长期目标和战略任务,属于建设学习型社会的重要内容;从社会实践而言,学分银行是激励学习者化零为整、积少成多的终身学习基地。在我国不同区域或教育领域的学分银行试点中,均出现社会回应度不高的问题。选择学习者视域观察继续教育两种不同类型的学分银行的实用性,提出学分银行应建立协同治理模式,与合作单位共建标准体系和规范流程,不断完善质量保障体系,并开展学习者需求与体验的长期调查等建议。建立以自学考试课程为基础的学分认定与学习成果转换机制,将丰富我国学习成果认证制度,与学分银行共同服务于终身学习体系。 展开更多
关键词 学分银行 自学考试 课程认证 学分认定 学习成果认证
下载PDF
基于Canny边缘检测的银行卡号识别研究
9
作者 张航 余粟 《计算机与数字工程》 2024年第6期1837-1841,1882,共6页
为了快速准确地获取银行卡号信息,论文提出了一种基于Canny边缘检测的模板匹配算法来对银行卡号进行识别。首先,对数字模板进行灰度图操作,二值化操作,然后提取外轮廓信息,并对模板上的数字进行排序。然后对待检测银行卡的图像进行一些... 为了快速准确地获取银行卡号信息,论文提出了一种基于Canny边缘检测的模板匹配算法来对银行卡号进行识别。首先,对数字模板进行灰度图操作,二值化操作,然后提取外轮廓信息,并对模板上的数字进行排序。然后对待检测银行卡的图像进行一些列形态学操作,根据绘制的轮廓大小比例锁定银行卡卡号的位置,并经过图像切割得到单个数字,最终将单个数字与模板进行匹配识别。实验结果表明,基于Canny算子边缘检测的模板匹配法识别准确率达93.2%。其识别准确率优于Sobel算子的模板匹配法。 展开更多
关键词 银行卡识别 形态学处理 CANNY边缘检测 模板匹配
下载PDF
基于高校在线开放课程的学分互换互认现状分析
10
作者 陈显明 范莹莹 《高教学刊》 2024年第25期91-94,共4页
对在线开放课程学分互换互认状况进行介绍。伴随在线开放课程蓬勃发展,越来越多的学生通过在线课程学习获得学分,学分互换互认有更大现实需求。我国开展学分互换互认理论研究已经有多年,高校中也出台相应的规章制度践行这种理论,特别在... 对在线开放课程学分互换互认状况进行介绍。伴随在线开放课程蓬勃发展,越来越多的学生通过在线课程学习获得学分,学分互换互认有更大现实需求。我国开展学分互换互认理论研究已经有多年,高校中也出台相应的规章制度践行这种理论,特别在一些大学城与高校联盟中在线开放课程学分普遍获得认可。介绍学分银行现状,学分银行是未来学分互换互认的一种有效机制。并分析学分互换互认中存在的一些问题,这些问题将影响学分互换互认的推广与施行。为推动在线开放课程的建设及使用,必须畅通学分互换互认渠道,加强在线开放课程质量保障机制,宣传和推广学分银行机制。 展开更多
关键词 在线开放课程 学分互换互认 学分银行 终身教育 课程质量
下载PDF
基于深度学习框架的银行卡识别系统的设计
11
作者 闫琳英 《现代信息科技》 2024年第9期83-86,共4页
为了减少手工输入银行卡号的错误,提高工作效率,文章基于深度学习技术和图像处理方法设计一个银行卡号自动识别系统。系统首先通过图像处理方法对银行卡图片进行预处理,定位卡号行位置,并采用主流TensorFlow深度学习框架构建深度卷积神... 为了减少手工输入银行卡号的错误,提高工作效率,文章基于深度学习技术和图像处理方法设计一个银行卡号自动识别系统。系统首先通过图像处理方法对银行卡图片进行预处理,定位卡号行位置,并采用主流TensorFlow深度学习框架构建深度卷积神经网络模型进行银行卡字符的提取和识别,最后利用PyQt5进行GUI界面搭建,实现银行卡号的输出可视化。文章通过在识别模型中加入Dropout技术提高模型的鲁棒性和泛化能力,实验表明,所设计的系统能够有效地识别银行卡号。 展开更多
关键词 深度学习 银行卡识别系统 字符识别 PyQt5
下载PDF
The segmentation algorithm for handwritten numeral strings in bank-check recognition 被引量:1
12
作者 ZHANG Chuang LIN Zhiqing +1 位作者 XIAO Bo GUO Jun 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2007年第1期39-44,共6页
In this paper,an integrated system of segmenting unconstrained handwritten numeral strings with unknowing number of digits is proposed,which consists of the extraction of connected components based on vertical project... In this paper,an integrated system of segmenting unconstrained handwritten numeral strings with unknowing number of digits is proposed,which consists of the extraction of connected components based on vertical projection and isolated components analysis,the length estimation of connected components using syntax analysis and waveform analysis and the segmentation of unconstrained connected handwritten numeral strings using innovative reverse“drop-falling”algorithm.This segmentation system which has promising results is then incorporated into a complete bank check character recognition system. 展开更多
关键词 bank check recognition SEGMENTATION length estimation of digit string
原文传递
基于滤波器组和残差网络的环境声音识别算法 被引量:4
13
作者 刘亚荣 于顼顼 谢晓兰 《计算机工程与设计》 北大核心 2023年第6期1736-1742,共7页
为解决现有传统环境声音识别技术识别率不高和普通卷积神经网络易出现网络退化的问题,提出一种基于滤波器组和残差网络的环境声音识别算法。采用滤波器组对声音信号进行特征提取,设计14层的残差网络,使用学习率衰减策略,将提取的特征输... 为解决现有传统环境声音识别技术识别率不高和普通卷积神经网络易出现网络退化的问题,提出一种基于滤波器组和残差网络的环境声音识别算法。采用滤波器组对声音信号进行特征提取,设计14层的残差网络,使用学习率衰减策略,将提取的特征输入到14层残差网络之中训练并测试。实验结果表明,在使用相同数据集ESC-10的情况下,与传统分类器模型和DCASE基线系统提供的识别方法相比,识别准确率分别提高了22.3%、17.4%和9.5%,验证了该方法在小样本情况下具有更高的识别准确率。 展开更多
关键词 网络退化 滤波器组 残差网络 环境声音识别 特征提取 学习率衰减 分类器模型
下载PDF
基于改进PCA_CNN的银行卡号识别模型 被引量:1
14
作者 郭小燕 陈鹏 +2 位作者 张明 张绿云 马楚奇 《软件导刊》 2023年第4期162-167,共6页
为降低图像噪声及PCA_CNN网络计算量,将彩色图像采用灰度化处理,利用Canny算子进行边缘处理,采用大津算法、轮廓提取算法完成银行卡数字区域识别,使该模型对图像的背景、光照、对比度有较强适应能力与抗干扰性。利用主成分分析法(PCA)... 为降低图像噪声及PCA_CNN网络计算量,将彩色图像采用灰度化处理,利用Canny算子进行边缘处理,采用大津算法、轮廓提取算法完成银行卡数字区域识别,使该模型对图像的背景、光照、对比度有较强适应能力与抗干扰性。利用主成分分析法(PCA)选取卷积神经网络(CNN)模型卷积核,从而避免大量迭代造成时间及算力浪费,对Sig⁃moid激活函数进行改进使其分段单调递增,从而提高识别准确率。改进后的PCA_CNN模型识别率为98.53%,与CNN模型、传统BP神经网络、SVM模型、Bytes模型、暹罗网络模型相比,在准确率与收敛速度方面均有一定优势。实验结果表明,改进后的PCA_CNN模型可以从手机等非专业摄影设备在自然光下拍摄的银行卡照片中有效提取银行卡号。 展开更多
关键词 PCA算法 CNN模型 银行卡号识别 深度学习
下载PDF
高职院校学习成果认定与学分转换的实践研究——以天津城市职业学院为例
15
作者 李彦 王立鹏 +1 位作者 袁美灵 雷珊珊 《天津职业院校联合学报》 2023年第9期40-47,共8页
《国家职业教育改革实施方案》关于“加快推进职业教育国家‘学分银行’建设”的部署,阐明了开展学习成果认定与学分转换的必要性。高职院校多功能办学中结合“学历证书+若干职业技能等级证书”制度试点工作,依托自身优势,搭建了学习成... 《国家职业教育改革实施方案》关于“加快推进职业教育国家‘学分银行’建设”的部署,阐明了开展学习成果认定与学分转换的必要性。高职院校多功能办学中结合“学历证书+若干职业技能等级证书”制度试点工作,依托自身优势,搭建了学习成果认定与学分转换制度体系、实施路径,推进学分银行建设,提炼分析学分认定与转换经验做法,对后期工作提出新的思考和优化建议。 展开更多
关键词 高职院校 学习成果认定 学分转换 学分银行
下载PDF
白鹤滩库区蓄水前活动性滑坡InSAR早期识别研究——以葫芦口镇至象鼻岭段为例 被引量:5
16
作者 顿佳伟 冯文凯 +2 位作者 易小宇 张国强 吴明堂 《工程地质学报》 CSCD 北大核心 2023年第2期479-492,共14页
白鹤滩水电站为我国仅次于三峡水电站的第二大水电站,库区葫芦口—象鼻岭库岸段居民点较多,库岸稳定问题是关注的重点。由于该库段受地形地貌、构造作用、复杂地层等影响,蓄水前可能存在现今正在发生微小变形且高位隐蔽的活动性滑坡,水... 白鹤滩水电站为我国仅次于三峡水电站的第二大水电站,库区葫芦口—象鼻岭库岸段居民点较多,库岸稳定问题是关注的重点。由于该库段受地形地貌、构造作用、复杂地层等影响,蓄水前可能存在现今正在发生微小变形且高位隐蔽的活动性滑坡,水库蓄水和运行期间,可能会进一步加剧此类滑坡变形,严重威胁周边居民生命财产安全,因此,蓄水前对该库段活动性滑坡进行有效识别与分析具有重要意义。本研究利用Sentinel-1A升降轨和ALOS-1升轨卫星,基于地形可视性的SBAS-InSAR(Small Baseline Subset-InSAR)技术对该重点库段的活动性滑坡进行了有效识别,共识别出27处活动性滑坡,野外验证最终确定23处,其中12处坡脚涉及蓄水位线。统计发现研究区活动性滑坡在10°~40°,坡向为东北、西北方向以及相对高差小于500 m条件下发育最多,大部分受断层控制,不受断层控制的滑坡灾害所处岩层强度较低。其研究成果有利于水库运行期间滑坡的预防与预警,整体技术流程与识别分析方法也可为今后复杂地形下的区域活动性滑坡识别与分析提供重要的参考依据。 展开更多
关键词 白鹤滩库区 葫芦口—象鼻岭库岸段 活动性滑坡 INSAR技术 早期识别
下载PDF
基于发声特征和深度学习的白羽肉鸡全生命周期咳嗽检测方法
17
作者 袁超 沈明霞 +2 位作者 姚文 刘龙申 陈佳 《南京农业大学学报》 CAS CSCD 北大核心 2023年第5期975-985,共11页
[目的]高密度养殖模式下笼养肉鸡呼吸系统疾病易发作且难防治,为此本文设计了一种基于发声特征和深度学习的白羽肉鸡全生命周期咳嗽检测方法,自动监测鸡只咳嗽发声,及时提供预警信息。[方法]对10~19日龄、20~29日龄、30日龄后3种不同生... [目的]高密度养殖模式下笼养肉鸡呼吸系统疾病易发作且难防治,为此本文设计了一种基于发声特征和深度学习的白羽肉鸡全生命周期咳嗽检测方法,自动监测鸡只咳嗽发声,及时提供预警信息。[方法]对10~19日龄、20~29日龄、30日龄后3种不同生长阶段的鸡只发声信号进行数字滤波、谱减法去噪、端点检测等处理,提取滤波器组(filter bank,FBank)和梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)特征,并与其各自一阶及二阶差分组合,作为VGG16与ResNet18神经网络的输入,完成咳嗽声、鸣叫声、其他声三分类模型训练。[结果]各日龄段利用不同发声特征与神经网络所构建的识别模型均能准确实现发声分类,在10~19日龄、20~29日龄FBank-VGG16模型效果较优,准确率分别为94.29%、97.65%,30日龄后MFCC-ResNet18模型准确率高于其他模型,为98.66%。随着日龄的增长,各模型的总体识别准确率均上升,增幅为3%~7%。[结论]本方法可快速准确对实际生产环境中不同生长阶段的鸡只咳嗽进行识别,为笼养鸡呼吸系统疾病的早期检测提供技术支撑。 展开更多
关键词 白羽肉鸡 咳嗽检测 滤波器组 梅尔频率倒谱系数 卷积神经网络
下载PDF
基于深度学习的银行客户身份识别算法研究 被引量:2
18
作者 冮震 曲娜 胡从强 《青岛理工大学学报》 CAS 2023年第1期147-152,共6页
为提高银行传统柜面现金区的客户身份识别效率和准确率,改变现有的人工加外拍设备识别方式,提出一种基于改进的VGGNet16与DenseNet融合的客户身份识别系统。该系统利用现金区内现有的安防摄像头来采集客户实时图像,运用深度学习的VGGNe... 为提高银行传统柜面现金区的客户身份识别效率和准确率,改变现有的人工加外拍设备识别方式,提出一种基于改进的VGGNet16与DenseNet融合的客户身份识别系统。该系统利用现金区内现有的安防摄像头来采集客户实时图像,运用深度学习的VGGNet16与DenseNet融合人脸识别算法对客户在人脸数据库中进行人证比对,以此达到客户身份识别的效果。对该系统进行应用表明,该系统能够利用现有设备资源,提高客户身份识别效率和准确率。 展开更多
关键词 人证比对 人脸识别 深度学习 银行业务 人脸数据库
下载PDF
学分银行视角下高职院校学习成果认证机制构建研究 被引量:1
19
作者 张琰 《湖北开放职业学院学报》 2023年第18期75-77,共3页
聚焦职业领域内对学分银行建设成果的现状,高职院校学分银行建设已经成为教育管理创新的重点内容之一。为形成完善合理的学习成果认证机制,助力实现高校管理能力现代化水平,研究认为,实现高职院校学习成果认证机制的构建,需要院校主体... 聚焦职业领域内对学分银行建设成果的现状,高职院校学分银行建设已经成为教育管理创新的重点内容之一。为形成完善合理的学习成果认证机制,助力实现高校管理能力现代化水平,研究认为,实现高职院校学习成果认证机制的构建,需要院校主体以学分银行组织框架为基础、以教育管理改革为高度实施建设,通过形成学分银行视角下的机制构建研究,同时关注机制构建的原则性要求和技术基础的平台建设,推动学习者终身学习的积极性与学校办学管理水平。 展开更多
关键词 学分银行 学习成果认证 学分认定 机制研究 课程学分
下载PDF
基于微信号增强的机器人远距离语音识别仿真 被引量:1
20
作者 卢丽萌 《辽宁大学学报(自然科学版)》 CAS 2023年第1期38-44,共7页
由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属... 由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果. 展开更多
关键词 微信号增强 远距离 语音识别 谱减法 功率谱 梅尔三角滤波器组 Mel频谱参数 梯度下降算法
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部