期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
Application of Cochlear Model in Speech Analysis/Synthesis Using Sinusoidal Representation 被引量:1
1
作者 Yuan Jingxian Wan Wanggen Yu Xiaoqing (School of Communication & Information Engineering, Shanghai University) 《Advances in Manufacturing》 SCIE CAS 1999年第1期47-52,共6页
A sinusoidal representation of speech and a cochlear model are used to extract speech parameters in this paper, and a speech analysis/synthesis system controlled by the auditory spectrum is developed with the model. T... A sinusoidal representation of speech and a cochlear model are used to extract speech parameters in this paper, and a speech analysis/synthesis system controlled by the auditory spectrum is developed with the model. The computer simulation shows that speech can be synthesized with only 12 parameters per frame on the average. The method has the advantages of few parameters, low complexity and high performance of speech representation. The synthetic speech has high intelligibility. 展开更多
关键词 speech analysis/synthesis sinusoidal representation cochlear model auditory spectrum
下载PDF
结合轻量卷积的非自回归语音合成方法
2
作者 钟巧霞 曾碧 +1 位作者 林镇涛 林伟 《计算机工程与设计》 北大核心 2024年第4期1166-1172,共7页
对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律... 对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律缺乏问题。训练模型获取梅尔频谱,结合预先训练好的声码器转化为音频。实验结果表明,提出的LCTTS模型优于先前提出的SpeedySpeech模型,在Emotional Speech Database数据集上平均意见得分获得2.8%的提升,梅尔倒谱失真测度下降0.15。 展开更多
关键词 语音合成 轻量级卷积 韵律合成 梅尔频谱生成 非自回归方法 深度学习 自然语言处理
下载PDF
基于多窗谱估计的改进维纳滤波语音增强 被引量:11
3
作者 张青 吴进 《计算机应用与软件》 2017年第3期67-70,118,共5页
为减少维纳滤波在语音增强中残留的"音乐噪声",将多窗谱估计和改进的维纳滤波方法结合,并进行语音合成。设计了基于多窗谱估计的改进维纳滤波语音增强方法,该方法采用多窗谱估计噪声功率谱,改进维纳滤波降噪得到增强语音,以... 为减少维纳滤波在语音增强中残留的"音乐噪声",将多窗谱估计和改进的维纳滤波方法结合,并进行语音合成。设计了基于多窗谱估计的改进维纳滤波语音增强方法,该方法采用多窗谱估计噪声功率谱,改进维纳滤波降噪得到增强语音,以及重叠相加语音合成,并给出仿真对比验证。结果表明,基于多窗谱估计的改进维纳滤波方法在抑制噪声,减少音乐噪声方面优于基于维纳滤波的增强算法和基于多窗谱估计的改进谱减法的增强算法。 展开更多
关键词 语音增强 多窗谱 改进维纳滤波 语音合成 重叠相加
下载PDF
基于线谱对高效矢量量化的0.6kb/s语音编码算法 被引量:2
4
作者 邹霞 何俊 张雄伟 《解放军理工大学学报(自然科学版)》 EI 2008年第2期114-118,共5页
为了提高通信系统的抗干扰和抗攻击能力,尽可能降低语音编码速率。提出了一种0.6 kb/s语音编码算法。算法基于3帧联合,对多帧联合参数采用高效矢量量化,在降低语音编码速率的条件下保证语音编码质量。其中,对线谱对参数采用预测多模式... 为了提高通信系统的抗干扰和抗攻击能力,尽可能降低语音编码速率。提出了一种0.6 kb/s语音编码算法。算法基于3帧联合,对多帧联合参数采用高效矢量量化,在降低语音编码速率的条件下保证语音编码质量。其中,对线谱对参数采用预测多模式多级矢量量化码本结构。在码本设计过程中,提出了多模式渐进闭环设计,对各类码本联合优化,并联合优化预测器和量化器,可以有效提高线谱对参数量化质量。在译码方,采用多带混和谐波激励提高合成语音清晰度。测试结果表明,该语音编码算法合成语音PESQ(perceptual evaluation of speech quality)得分可以达到2.7,汉语诊断押韵测试DRT(diagnostic rhyme test)得分可以达到89.7。 展开更多
关键词 语音编码 矢量量化 语音合成 线谱对
下载PDF
语音短时分析与合成的滤波器实现
5
作者 吴树兴 刘新红 《信息与电脑》 2019年第15期50-52,共3页
频谱分析技术在语音信号处理中得到了广泛应用。短时频谱分析是各种语音频域处理方法的基础,广泛应用于语音编解码、语音合成、语音识别等领域。通过时频分析理论,对语音短时频谱分析与合成进行理论推导,表明语音短时频谱分析与合成可... 频谱分析技术在语音信号处理中得到了广泛应用。短时频谱分析是各种语音频域处理方法的基础,广泛应用于语音编解码、语音合成、语音识别等领域。通过时频分析理论,对语音短时频谱分析与合成进行理论推导,表明语音短时频谱分析与合成可以通过加窗和滤波语音信号实现,并据此提出具体算法,按照该算法处理实际语音数据。合成语音与原始语音相比,差异很小。 展开更多
关键词 语音短时频谱分析 语音短时频谱合成 窗口滤波器
下载PDF
语音合成及伪造、鉴伪技术综述 被引量:8
6
作者 杨帅 乔凯 +2 位作者 陈健 王林元 闫镔 《计算机系统应用》 2022年第7期12-22,共11页
近年来随着移动智能设备的兴起,人们越来越频繁的接触和使用语音信息,语音伪造和鉴伪成为语音处理领域中愈加重要的技术.本文首先梳理了语音合成系统的一般流程,并对语音伪造领域中主要的文本到语音(textto-speech,TTS)和语音转换(voice... 近年来随着移动智能设备的兴起,人们越来越频繁的接触和使用语音信息,语音伪造和鉴伪成为语音处理领域中愈加重要的技术.本文首先梳理了语音合成系统的一般流程,并对语音伪造领域中主要的文本到语音(textto-speech,TTS)和语音转换(voice conversion,VC)两项技术进行系统归纳;接着,对语音鉴伪技术中常见的算法进行介绍和分类;最后,针对语音伪造和鉴伪目前存在的问题,本文从数据、模型、训练方法以及应用场景等多个角度出发提出未来可能的发展方向. 展开更多
关键词 语音伪造 神经网络 频谱转换 检测技术 语音合成
下载PDF
基于CBHG的Mel谱精细结构重建 被引量:1
7
作者 唐君 张连海 李嘉欣 《信息工程大学学报》 2022年第2期135-140,共6页
在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量。基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此问题,提出一种基于CBHG的后处理网络。该后处理网络通过对解码输出的Mel谱进行分析... 在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量。基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此问题,提出一种基于CBHG的后处理网络。该后处理网络通过对解码输出的Mel谱进行分析并预测其缺失的精细结构,最后将这些精细结构叠加到解码输出的Mel谱中以生成细化后的Mel谱,从而提高合成语音的质量。实验结果表明,提出的后处理网络有效恢复了Mel谱在解码过程中丢失的精细结构,同时通过结合高性能、高效率的HiFi-GAN声码器,最终合成语音的平均主观意见分(Mean Opinion Score,MOS)达到4.10,相比基线提升了0.26。 展开更多
关键词 语音合成 CBHG Mel谱 后处理网络 Tacotron 2 HiFi-GAN
下载PDF
基于正弦表示与耳蜗模型的语音分析与合成
8
作者 袁京贤 万旺根 余小清 《上海大学学报(自然科学版)》 CAS CSCD 1998年第5期520-526,共7页
本文采用语音信号的正弦表示方法并利用耳蜗模型提取了语音信号的基本特征参数,建立了一个语音分析/合成系统.通过计算机仿真,对原始语音信号进行了特征参数提取,实验表明平均每帧只需12个参数就能合成语音.利用这种方法对语音... 本文采用语音信号的正弦表示方法并利用耳蜗模型提取了语音信号的基本特征参数,建立了一个语音分析/合成系统.通过计算机仿真,对原始语音信号进行了特征参数提取,实验表明平均每帧只需12个参数就能合成语音.利用这种方法对语音信号进行处理,可望得到一种新的低速语音编码方法,该方法具有算法复杂度低、合成语音好等优点. 展开更多
关键词 正弦表示 耳蜗模型 语音分析 语音合成
下载PDF
多带激励MBE谱幅度估计与参数编解码方案研究
9
作者 李建锋 唐斌 《电子设计工程》 2011年第16期119-122,共4页
随着多带激励MBE模型的成功运用,MBE语音编解码算法也日新月易。介绍了多带激励MBE谱幅度参数和V/U判决参数的提取,阐述了参数的编解码方案,对谱幅度量化时,先作离散余弦变换(DCT),然后进行了矢量量化(VQ);最后介绍了语音信号的合成,通... 随着多带激励MBE模型的成功运用,MBE语音编解码算法也日新月易。介绍了多带激励MBE谱幅度参数和V/U判决参数的提取,阐述了参数的编解码方案,对谱幅度量化时,先作离散余弦变换(DCT),然后进行了矢量量化(VQ);最后介绍了语音信号的合成,通过实验验证了合成语音与原始语音在频率和幅度上几乎一致,说明该方法在合成语音的质量上比较理想。 展开更多
关键词 多带激励 谱幅度估计 参数编解码 清音语音合成 浊音语音合成
下载PDF
LSP参数的语音分析和合成研究
10
作者 杨红云 向茂楠 《北京理工大学学报》 EI CAS CSCD 1992年第1期71-77,共7页
通过对线谱对(LSP)在语音分析和合成中的计算机模拟实验,证明了LSP参数是频域内的参数,可以直接跟踪共振峰,进行基音提取和清/浊音判断;具有较好的平稳性、内插特性和量化特性.利用频谱性质,提出了用双向比较求取LSP参数的方法,能有效... 通过对线谱对(LSP)在语音分析和合成中的计算机模拟实验,证明了LSP参数是频域内的参数,可以直接跟踪共振峰,进行基音提取和清/浊音判断;具有较好的平稳性、内插特性和量化特性.利用频谱性质,提出了用双向比较求取LSP参数的方法,能有效地简化求解运算。与PARCOR参数相比,要得到同等音质的语音,用LSP参数可减少25%左右的数码率。 展开更多
关键词 言语分析 言语合成 言语码 线谱对
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部