期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于线性预测模型的氦语音增强算法研究 被引量:3
1
作者 张勇 赵晓群 《声学技术》 CSCD 北大核心 2007年第1期111-116,共6页
潜水员在水下工作时,由于生理方面的原因,需要以氦氧混合气体作为呼吸气体,由于气体结构的变化出现了氦语音现象,使得语音发生畸变,降低了清晰度。通过介绍基于线性预测模型的氦语音增强算法,将频域的线谱对(LSP)分析应用于氦语音增强中... 潜水员在水下工作时,由于生理方面的原因,需要以氦氧混合气体作为呼吸气体,由于气体结构的变化出现了氦语音现象,使得语音发生畸变,降低了清晰度。通过介绍基于线性预测模型的氦语音增强算法,将频域的线谱对(LSP)分析应用于氦语音增强中,由于线谱对系数与语音信号谱包络有紧密的联系,用线谱对参数(LSP)构成合成滤波器时更容易保证稳定性,所以提出了一种基于线谱对系数(LSP)的氦语音增强算法。通过实验将这种算法与基于线性预测LPC的增强算法进行了比较,实验结果表明,两种算法均能对氦语音进行矫正,并且新的算法能够对共振峰进行单独调节,在不影响清晰度的同时最大限度地保持了原有语音的细节,提高了可懂度。 展开更多
关键词 氦语音 线性预测模型 线谱对系数
下载PDF
氦语音增强算法的研究 被引量:2
2
作者 成少锋 李双田 邓昊 《应用声学》 CSCD 北大核心 2004年第2期15-19,共5页
当潜水员深海作业时,由于生理方面的原因,需要以氦氧混合气体为呼吸介质替代空气,但这时会出现所谓的“氦语音”现象,语音产生很大畸变,清晰度极低。本文给出了氦语音的基本变化规律,介绍了两种分别基于短时傅立叶变换和线性预测模型的... 当潜水员深海作业时,由于生理方面的原因,需要以氦氧混合气体为呼吸介质替代空气,但这时会出现所谓的“氦语音”现象,语音产生很大畸变,清晰度极低。本文给出了氦语音的基本变化规律,介绍了两种分别基于短时傅立叶变换和线性预测模型的增强算法。我们的实验结果表明,两种算法均能显著校正氦语音,提高清晰度。 展开更多
关键词 氦语音增强算法 深海作业 语音畸变 短时傅立叶变换
下载PDF
一种采用机器学习的氦语音识别方法
3
作者 李冬梅 李明 +1 位作者 郭莉莉 张士兵 《电讯技术》 北大核心 2022年第9期1215-1221,共7页
为了解决传统氦语音处理技术存在的处理速度慢、计算复杂、操作困难等问题,提出了一种采用机器学习的氦语音识别方法,通过深层网络学习高维信息、提取多种特征,不但解决了过拟合问题,同时也具备了字错率(Word Error Rate,WER)低、收敛... 为了解决传统氦语音处理技术存在的处理速度慢、计算复杂、操作困难等问题,提出了一种采用机器学习的氦语音识别方法,通过深层网络学习高维信息、提取多种特征,不但解决了过拟合问题,同时也具备了字错率(Word Error Rate,WER)低、收敛速度快的优点。首先自建氦语音孤立词和连续氦语音数据库,对氦语音数据预处理,提取的语音特征主要包括共振峰特征、基音周期特征和FBank(Filter Bank)特征。之后将语音特征输入到由深度卷积神经网络(Deep Convolutional Neural Network,DCNN)和连接时序分类(Connectionist Temporal Classification,CTC)组成的声学模型进行语音到拼音的建模,最后应用Transformer语言模型得到汉字输出。提取共振峰特征、基音周期特征和FBank特征的氦语音孤立词识别模型相比于仅提取FBank特征的识别模型的WER降低了7.91%,连续氦语音识别模型的WER降低了14.95%。氦语音孤立词识别模型的最优WER为1.53%,连续氦语音识别模型的最优WER为36.89%。结果表明,所提方法可有效识别氦语音。 展开更多
关键词 氦语音 语音识别 机器学习 深度卷积神经网络(DCNN) 连接时序分类(CTC)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部