-
题名基于线性预测模型的氦语音增强算法研究
被引量:3
- 1
-
-
作者
张勇
赵晓群
-
机构
河北工业大学信息工程学院
同济大学电信学院
-
出处
《声学技术》
CSCD
北大核心
2007年第1期111-116,共6页
-
文摘
潜水员在水下工作时,由于生理方面的原因,需要以氦氧混合气体作为呼吸气体,由于气体结构的变化出现了氦语音现象,使得语音发生畸变,降低了清晰度。通过介绍基于线性预测模型的氦语音增强算法,将频域的线谱对(LSP)分析应用于氦语音增强中,由于线谱对系数与语音信号谱包络有紧密的联系,用线谱对参数(LSP)构成合成滤波器时更容易保证稳定性,所以提出了一种基于线谱对系数(LSP)的氦语音增强算法。通过实验将这种算法与基于线性预测LPC的增强算法进行了比较,实验结果表明,两种算法均能对氦语音进行矫正,并且新的算法能够对共振峰进行单独调节,在不影响清晰度的同时最大限度地保持了原有语音的细节,提高了可懂度。
-
关键词
氦语音
线性预测模型
线谱对系数
-
Keywords
helium speech
linear prediction
line spectrum pair (LSP)
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名氦语音增强算法的研究
被引量:2
- 2
-
-
作者
成少锋
李双田
邓昊
-
机构
中国科学院声学研究所
-
出处
《应用声学》
CSCD
北大核心
2004年第2期15-19,共5页
-
基金
中国科学院声学研究所知识创新工程前瞻性项目基金资助
-
文摘
当潜水员深海作业时,由于生理方面的原因,需要以氦氧混合气体为呼吸介质替代空气,但这时会出现所谓的“氦语音”现象,语音产生很大畸变,清晰度极低。本文给出了氦语音的基本变化规律,介绍了两种分别基于短时傅立叶变换和线性预测模型的增强算法。我们的实验结果表明,两种算法均能显著校正氦语音,提高清晰度。
-
关键词
氦语音增强算法
深海作业
语音畸变
短时傅立叶变换
-
Keywords
helium speech, Short-term fourier transform, Linear prediction
-
分类号
TB56
[交通运输工程—水声工程]
TN912.35
[电子电信—通信与信息系统]
-
-
题名一种采用机器学习的氦语音识别方法
- 3
-
-
作者
李冬梅
李明
郭莉莉
张士兵
-
机构
南通大学信息科学技术学院
-
出处
《电讯技术》
北大核心
2022年第9期1215-1221,共7页
-
基金
国家自然科学基金资助项目(61871241)
江苏省科研与实践创新计划项目(KYCX20_2828)。
-
文摘
为了解决传统氦语音处理技术存在的处理速度慢、计算复杂、操作困难等问题,提出了一种采用机器学习的氦语音识别方法,通过深层网络学习高维信息、提取多种特征,不但解决了过拟合问题,同时也具备了字错率(Word Error Rate,WER)低、收敛速度快的优点。首先自建氦语音孤立词和连续氦语音数据库,对氦语音数据预处理,提取的语音特征主要包括共振峰特征、基音周期特征和FBank(Filter Bank)特征。之后将语音特征输入到由深度卷积神经网络(Deep Convolutional Neural Network,DCNN)和连接时序分类(Connectionist Temporal Classification,CTC)组成的声学模型进行语音到拼音的建模,最后应用Transformer语言模型得到汉字输出。提取共振峰特征、基音周期特征和FBank特征的氦语音孤立词识别模型相比于仅提取FBank特征的识别模型的WER降低了7.91%,连续氦语音识别模型的WER降低了14.95%。氦语音孤立词识别模型的最优WER为1.53%,连续氦语音识别模型的最优WER为36.89%。结果表明,所提方法可有效识别氦语音。
-
关键词
氦语音
语音识别
机器学习
深度卷积神经网络(DCNN)
连接时序分类(CTC)
-
Keywords
helium speech
speech recognition
machine learning
deep convolution neural network(DCNN)
connectionist temporal classification(CTC)
-
分类号
TN912.3
[电子电信—通信与信息系统]
TP181
[自动化与计算机技术—控制理论与控制工程]
-