期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种采用定点DSP实现的1.8kbps MBE-LPC声码器 被引量:1
1
作者 李永明 陈弘毅 朱益厅 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2000年第8期803-809,共7页
提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合... 提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e. 展开更多
关键词 MBE-LPG 语音合成 声码器 数字信号处理
下载PDF
基于梯度归一化的端到端语音合成自适应损失权衡
2
作者 陈宽 陈涛 +2 位作者 尤玮珂 周琳娜 杨忠良 《网络空间安全科学学报》 2024年第1期72-82,共11页
语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型... 语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型,能够生成质量更高、听感更自然的语音。然而,现有模型依赖多个损失函数,暂时缺乏对其有效权衡的研究。因此,在现有模型损失函数的基础上,引入了梯度归一化自适应损失平衡优化方法,它根据模型不同损失函数的量级与不同子任务的训练速度来平衡各损失函数之间的权重,以验证该方法在语音合成任务中的适用性。在公开的中文语音合成数据集上评估了该方法合成语音的准确度与自然度,结果表明,采用此损失函数的模型在性能上得到了提升,证明了方法的有效性。 展开更多
关键词 文本转语音 端到端语音合成 多任务学习 多目标优化 梯度归一化
下载PDF
基于HiFi-GAN的改进型高效声码器 被引量:1
3
作者 唐君 张连海 +1 位作者 李嘉欣 李宜亭 《信号处理》 CSCD 北大核心 2022年第9期1988-1998,共11页
HiFi-GAN声码器通过采用缩减网络层的通道数或层数的方式来有效减少模型参数、提高推理速度,但此种方式也严重损害了生成语音的质量。针对此问题,提出了两点改进措施:1.采用多尺度卷积策略对输入Mel谱进行处理来有效表征特征信息;2.采... HiFi-GAN声码器通过采用缩减网络层的通道数或层数的方式来有效减少模型参数、提高推理速度,但此种方式也严重损害了生成语音的质量。针对此问题,提出了两点改进措施:1.采用多尺度卷积策略对输入Mel谱进行处理来有效表征特征信息;2.采用一维深度可分离卷积替换生成器网络中的标准一维卷积。实验结果表明,多尺度卷积策略有效提升了模型性能,提高了生成语音的质量,而一维深度可分离卷积显著减少了模型参数量并加快了模型推理速度。通过将这两者结合,有效提升了HiFi-GAN模型的性能,具体来说,模型参数量约减少了67.72%,在GPU、CPU上的推理速度分别提升了11.72%、28.98%。此外,语音质量也得到略微提升,平均主观意见分(Mean Opinion Score,MOS)提升了0.07,客观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)得分提升了0.05。 展开更多
关键词 语音合成 声码器 HiFi-GAN 深度可分离卷积 多尺度卷积策略
下载PDF
机载多通道语音信号自适应合成
4
作者 黄钰 王立 +2 位作者 雷志雄 张绪皓 史高翔 《电讯技术》 北大核心 2023年第4期522-528,共7页
机载环境下,超短波通信系统由于电磁干扰等诸多原因,容易导致接收到的语音出现断续。引入基于空-时模型的线性约束最小方差(Spatio-Temporal Linearly Constrained Minimum Variance,ST-LCMV)方法来对多通道的语音信号进行合成,保证话... 机载环境下,超短波通信系统由于电磁干扰等诸多原因,容易导致接收到的语音出现断续。引入基于空-时模型的线性约束最小方差(Spatio-Temporal Linearly Constrained Minimum Variance,ST-LCMV)方法来对多通道的语音信号进行合成,保证话音的完整性,增强话音的稳定性。构建了多通道语音信号合成(Multi-channel Speech Signal Synthesis,MSSS)算法并使用真实的机载噪声进行仿真验证,结果表明,MSSS能保留完整的语音信息,并且在实验设置的机载噪声环境下具有普适性。MSSS输出信号的语音感知质量评估(Perceptual Evaluation of Speech Quality,PESQ)分数相对于等增益合并提高了0.4518分。 展开更多
关键词 机载超短波通信 多通道语音信号合成 信息互补 自适应波束形成方法
下载PDF
基于多窗谱估计的改进维纳滤波语音增强 被引量:11
5
作者 张青 吴进 《计算机应用与软件》 2017年第3期67-70,118,共5页
为减少维纳滤波在语音增强中残留的"音乐噪声",将多窗谱估计和改进的维纳滤波方法结合,并进行语音合成。设计了基于多窗谱估计的改进维纳滤波语音增强方法,该方法采用多窗谱估计噪声功率谱,改进维纳滤波降噪得到增强语音,以... 为减少维纳滤波在语音增强中残留的"音乐噪声",将多窗谱估计和改进的维纳滤波方法结合,并进行语音合成。设计了基于多窗谱估计的改进维纳滤波语音增强方法,该方法采用多窗谱估计噪声功率谱,改进维纳滤波降噪得到增强语音,以及重叠相加语音合成,并给出仿真对比验证。结果表明,基于多窗谱估计的改进维纳滤波方法在抑制噪声,减少音乐噪声方面优于基于维纳滤波的增强算法和基于多窗谱估计的改进谱减法的增强算法。 展开更多
关键词 语音增强 多窗谱 改进维纳滤波 语音合成 重叠相加
下载PDF
4.8kbps多带激励语音编码器的模拟实现 被引量:3
6
作者 王都生 樊昌信 《西安电子科技大学学报》 EI CAS CSCD 北大核心 1995年第3期227-234,共8页
文章阐述了多带激励(MBE)语音产生模型与以往单一激励语音产生模型的区别及其优越性。研究了以MBE模型为基础进行语音分析合成的基本原理和实现的算法。提出了4.8kbpsMBE语音编码方案,并在计算机上进行了模拟实现。... 文章阐述了多带激励(MBE)语音产生模型与以往单一激励语音产生模型的区别及其优越性。研究了以MBE模型为基础进行语音分析合成的基本原理和实现的算法。提出了4.8kbpsMBE语音编码方案,并在计算机上进行了模拟实现。实验结果表明,所模拟的4.8kbpsMBE语音编码器系统是成功的。其合成语音在可懂度与自然度方面,与以往的线性预测(LPC)、码激励线性预测(CELP)语音编码系统相比都有了明显的改善。 展开更多
关键词 多带激励 编码器 语音编码器 计算机模拟
下载PDF
基于多元激励的高质量语音合成声学模型 被引量:1
7
作者 陶建华 康永国 《中文信息学报》 CSCD 北大核心 2004年第3期73-80,共8页
传统的参数语音合成系统 ,多采用单纯的源滤波模型 ,缺少变化 ,通常导致在韵律变化较大或生成特定语气时 ,音质损伤较大。本文则在语音逆滤波过程的基础上 ,对声源在不同韵律特征和音色条件下的变化进行了仔细的比较分析 ,通过声源的重... 传统的参数语音合成系统 ,多采用单纯的源滤波模型 ,缺少变化 ,通常导致在韵律变化较大或生成特定语气时 ,音质损伤较大。本文则在语音逆滤波过程的基础上 ,对声源在不同韵律特征和音色条件下的变化进行了仔细的比较分析 ,通过声源的重构、分类 ,进而形成了适用于多种韵律特征和音色特征的多元激励(Multi-Source ,MS)模型。在此基础构建了基于多元激励的语音合成的声学模型 ,在一定意义上较大的提高了语音合成在大范围语气变化中的合成质量 ,对个性化语音合成 ,以及超小型语音合成系统的建立起到了较好的推动作用。 展开更多
关键词 计算机应用 中文信息处理 语音合成 声学模型 声源 多元激励
下载PDF
基于VB6.0的多语音合成系统的实现 被引量:1
8
作者 高伟 肖攸安 刘冬生 《武汉理工大学学报(信息与管理工程版)》 CAS 2008年第6期869-872,876,共5页
针对当前语音合成只能实现单一语言的局限,设计了一种基于VB6.0的多语音合成系统。阐述了该系统实现的基本原理,对系统实现中所采用的程序链接语音库的独特设计方法进行了详细分析,最终给出了软件的测试结果。结果表明,该系统能够对中... 针对当前语音合成只能实现单一语言的局限,设计了一种基于VB6.0的多语音合成系统。阐述了该系统实现的基本原理,对系统实现中所采用的程序链接语音库的独特设计方法进行了详细分析,最终给出了软件的测试结果。结果表明,该系统能够对中英文混合文本的语法、句法进行分析处理,通过调用语音库实现语音合成功能,语音合成效果良好,并且这种处理方法可以推广到更多语种的语音合成应用领域。 展开更多
关键词 VB6.0 软件系统 语音库 多语音合成
下载PDF
一种基于多属性模糊决策的英文韵律短语边界预测方法
9
作者 汪丹丹 《西安文理学院学报(自然科学版)》 2018年第6期64-67,共4页
对于各类TTS(Text to Speech)系统而言,能否准确地预测韵律短语边界对TTS系统的效果有着关键性的影响.目前常使用决策树来做韵律短语边界预测,但这种方法受到了训练数据的均衡性以及决策算法本身无法达到全局最优的制约.为了改善预测效... 对于各类TTS(Text to Speech)系统而言,能否准确地预测韵律短语边界对TTS系统的效果有着关键性的影响.目前常使用决策树来做韵律短语边界预测,但这种方法受到了训练数据的均衡性以及决策算法本身无法达到全局最优的制约.为了改善预测效果,在传统的决策树方法之上,将决策树使用的聚类属性与模糊决策相结合,提出通过多属性模糊决策方法来预测英文韵律短语边界.实验表明,使用这种方法后,效果比基于决策树的预测方法的效果有较大提升,F-Score由64. 4%提升到69. 3%,不可接受率也从28. 6%降低到21. 4%. 展开更多
关键词 英文语音合成 韵律短语边界 决策树 多属性模糊决策
下载PDF
古漢語輕動詞研究——以“發”“生”爲例 被引量:2
10
作者 宋亞雲 《历史语言学研究》 CSSCI 2017年第1期43-65,共23页
本文根據形式和意義相結合的標準區分了虛化輕動詞和實義動詞,以'發'和'生'爲例,詳細描寫了這兩個虛化輕動詞的發展演變過程。然後结合輕動詞'發''生'的演變探討漢語從綜合到分析的演變趨勢,指出'... 本文根據形式和意義相結合的標準區分了虛化輕動詞和實義動詞,以'發'和'生'爲例,詳細描寫了這兩個虛化輕動詞的發展演變過程。然後结合輕動詞'發''生'的演變探討漢語從綜合到分析的演變趨勢,指出'發''生'等系列輕動詞的大量運用,或使得一批名動兼類詞分化爲名詞和動詞,或使得部分詞類活用現象逐步減少。 展开更多
关键词 輕動詞 綜合 分析 兼類詞 詞類活用
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部