期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
结合语音融合特征和随机森林的构音障碍识别 被引量:9
1
作者 李东 张雪英 +1 位作者 段淑斐 闫密密 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2018年第3期149-155,共7页
为分析病理人群与正常人群的发音差异性,提出一种结合语音融合特征和随机森林的语音识别方法来进行正常语音与构音障碍语音的分类识别,从而为医学诊断和治疗提供科学和客观的依据.首先,使用多伦多大学开发的病理语音数据库,提取出语音... 为分析病理人群与正常人群的发音差异性,提出一种结合语音融合特征和随机森林的语音识别方法来进行正常语音与构音障碍语音的分类识别,从而为医学诊断和治疗提供科学和客观的依据.首先,使用多伦多大学开发的病理语音数据库,提取出语音的五种韵律特征以及梅尔频率倒谱系数,再计算其统计特征,构成融合特征,最后结合随机森林算法进行分类识别.结果显示,相比于单一类型特征,提出的融合特征在识别性能上有着显著优化作用,与随机森林分类器结合后,对于男性声音的分类准确率达到99.21%,对于女性声音的分类准确率达到98.97%,综合分类准确率达到98.00%.同时研究还发现,相较于句子,患者对短语的发音更为准确. 展开更多
关键词 韵律特征 梅尔频率倒谱系数 融合特征 随机森林 构音障碍识别
下载PDF
基于VMD的双通道构音障碍语音特征图谱提取算法
2
作者 薛珮芸 白静 +1 位作者 张楠 赵建星 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期793-801,共9页
针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(... 针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(BCFbank)特征提取算法,该算法采用Mel滤波后做对数变换,同时采用Gammatone滤波后作非线性响度变换;其次,采用VMD来优化BCFbank特征,对分解后的多个语音信号分量筛选出相关系数较高的3个,分别提取其BCFbank特征及其差分特征,同时对未分解的语音信号提取BCFbank特征,从而构成MBCFbank特征图谱;最后,在双路语音识别模型上进行训练和识别.实验结果表明,基于BCFbank特征、MBCFbank特征图谱的语音识别模型准确率最高分别达到了87.82%,94.34%,优于Fbank特征的识别效果. 展开更多
关键词 构音障碍语音识别 变分模态分解 卷积神经网络 MBCFbank特征
下载PDF
基于多特征组合的构音障碍语音识别 被引量:7
3
作者 梁正友 黎雨星 +1 位作者 孙宇 姚强 《计算机工程与设计》 北大核心 2022年第2期567-572,共6页
为提高构音障碍识别准确率,提出一种基于多特征组合的构音障碍语音识别方法。利用遗传算法进行特征选择,从语音的韵律特征、频谱特征、人耳听觉特征、嗓音质量特征和声道模型特征等5类特征组合成的多特征组合中选择出分类准确率最高的... 为提高构音障碍识别准确率,提出一种基于多特征组合的构音障碍语音识别方法。利用遗传算法进行特征选择,从语音的韵律特征、频谱特征、人耳听觉特征、嗓音质量特征和声道模型特征等5类特征组合成的多特征组合中选择出分类准确率最高的特征子集,通过SVM分类器对选择出的特征进行识别。在Torgo声学和发音数据库对不同的语音刺激类型进行模拟实验,实验结果表明,提出方法对Torgo数据库的3种语音刺激类型的平均准确率为97.52%,优于现有的识别方法。 展开更多
关键词 构音障碍识别 多特征组合 遗传算法 特征选择 支持向量机
下载PDF
结合差分演化和逻辑回归的构音障碍自动识别方法 被引量:1
4
作者 黎雨星 梁正友 孙宇 《计算机与现代化》 2019年第8期1-5,共5页
针对传统的构音障碍诊断方法存在耗时高、成本高等问题,提出一种构音障碍语音的计算机自动识别方法。结合Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficients, GFCC)与常用声学特征形成组合声学特征,应用差分演化算法进... 针对传统的构音障碍诊断方法存在耗时高、成本高等问题,提出一种构音障碍语音的计算机自动识别方法。结合Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficients, GFCC)与常用声学特征形成组合声学特征,应用差分演化算法进行特征选择,并使用逻辑回归分类器对构音障碍语音进行识别。将Torgo构音障碍语音数据库分成3个语音子集,分别是非词、短词语、限制句子集,提取24维GFCC和37维常用的声学特征构成组合声学特征,最后使用差分演化算法和逻辑回归分类器进行分类识别。实验表明:使用差分演化算法可以有效选择出具有更佳识别能力的特征,从而显著提高构音障碍识别率。在非词子集上的实验准确率达到98.18%,召回率为98.3%,精确率为98.3%。 展开更多
关键词 GFCC 差分演化算法 逻辑回归 构音障碍识别
下载PDF
基于梯度提升决策树的病理语音识别
5
作者 姜子星 叶武剑 +1 位作者 吕友成 刘怡俊 《电脑知识与技术》 2021年第35期131-133,共3页
病理语音是患者神经系统受损导致发音运动不协调所产生的语音。现有病理语音分析方法大多数采用频域语音特征如梅尔倒谱系数,并且识别模型也大多采用支持向量机模型。因此,提出一种时频特征短时傅里叶变换系数与梯度提升决策树的病理语... 病理语音是患者神经系统受损导致发音运动不协调所产生的语音。现有病理语音分析方法大多数采用频域语音特征如梅尔倒谱系数,并且识别模型也大多采用支持向量机模型。因此,提出一种时频特征短时傅里叶变换系数与梯度提升决策树的病理语音识别模型。首先,使用自建的脑卒中构音障碍数据集,提取语音的时频特征短时傅里叶变换系数。随后,结合梯度提升决策树算法进行分类识别。实验结果表明,提出的声学特征能够胜任脑卒中构音障碍识别任务。与梯度提升决策树分类器结合后,音节级别的准确率为68.5%,上升到说话人级别后准确率达到88.2%。 展开更多
关键词 梯度提升决策树 构音障碍识别 时频特征
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部