期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种新型带通滤波器的设计及在语音分析/合成中的应用
1
作者 余小清 万旺根 《上海大学学报(自然科学版)》 CAS CSCD 1997年第S1期76-80,共5页
本文利用双线性变换,由一模拟带通滤波器得到了一数字式带通滤波器,并给出了该数字式带通滤波器系数与其中心频率及带宽的数学关系式.以此数字带通滤波器为原型滤波器,得出了一种数字式带通滤波器的级联设计法,并将此滤波器用于耳... 本文利用双线性变换,由一模拟带通滤波器得到了一数字式带通滤波器,并给出了该数字式带通滤波器系数与其中心频率及带宽的数学关系式.以此数字带通滤波器为原型滤波器,得出了一种数字式带通滤波器的级联设计法,并将此滤波器用于耳蜗模型的语音分析/合成中,得到了较好的效果.该种滤波器具有系数少、结构简单、设计快等优点,很适合于各种信息处理中数字滤波器的硬件实现. 展开更多
关键词 带通滤波器 原型滤波器 语音分析/合成
下载PDF
语音信号的加权mel倒谱分析 被引量:4
2
作者 黄德智 杨鸿武 蔡莲红 《信号处理》 CSCD 北大核心 2006年第6期840-843,共4页
本文利用人耳的感知特性,提出了加权mel倒谱系数,并建立了相应的分析算法。实验结果表明,该系数不仅能够准确地刻画说话人声道的短时特征,还能用来重建出高质量的语音。因此加权mel倒谱分析不仅能够应用于语音识别和说话人识别,还能应... 本文利用人耳的感知特性,提出了加权mel倒谱系数,并建立了相应的分析算法。实验结果表明,该系数不仅能够准确地刻画说话人声道的短时特征,还能用来重建出高质量的语音。因此加权mel倒谱分析不仅能够应用于语音识别和说话人识别,还能应用于语音编码和参数合成。 展开更多
关键词 听觉特性 语音信号倒谱分析 语音分析合成
下载PDF
稀疏谱线合成对元音频域信息分布的探讨
3
作者 刘惠华 潘建军 +1 位作者 周冰 范京 《北京机械工业学院学报》 2005年第1期1-4,共4页
一般语音信号的合成分析是采用线性预测系数参数或共振峰等参数,根据选定 的误差准则,调整参数,使得原始语音与合成语音二者误差最小,从中分析语音的有关性质。利用 稀疏谱线进行傅立叶反变换来合成元音,提取元音信号频谱中的几根或者... 一般语音信号的合成分析是采用线性预测系数参数或共振峰等参数,根据选定 的误差准则,调整参数,使得原始语音与合成语音二者误差最小,从中分析语音的有关性质。利用 稀疏谱线进行傅立叶反变换来合成元音,提取元音信号频谱中的几根或者几十根谱线进行反变换 来合成元音,由试听者进行听辨实验,考察合成语音的清晰度,从频域对语音信号中的信息分布进 行探讨。给出了实验结果与结论。 展开更多
关键词 稀疏谱线合成 语音合成分析 语音信息分布 语音信号处理 元音频域
下载PDF
由嘴唇视频直接生成语音的研究
4
作者 贾振堂 《计算机应用研究》 CSCD 北大核心 2020年第6期1890-1894,共5页
为了更便捷地实现唇声转换,提出了一种由嘴唇视频直接生成语音的方法,并对相关问题进行了研究。首先同步地计算视频文件中的嘴唇运动特征和对应的LPC10话音编码参数,然后借助LSTM人工神经网络进行端到端的训练。训练后的网络模型可以将... 为了更便捷地实现唇声转换,提出了一种由嘴唇视频直接生成语音的方法,并对相关问题进行了研究。首先同步地计算视频文件中的嘴唇运动特征和对应的LPC10话音编码参数,然后借助LSTM人工神经网络进行端到端的训练。训练后的网络模型可以将嘴唇运动特征映射为语音编码参数,再采用语音合成技术将语音编码参数转换成可以播放的语音样值数据。该方法跳过了中间的文字环节,因此称为直接生成,具有可方便地得到训练样本、无须人工标注的优点,同时也可以避免文本重建语音方法中存在的发音歧义。测试结果表明,在词汇量有限的应用情境中,该方法可以由嘴唇视频重建较为清晰可懂的语音。 展开更多
关键词 嘴唇运动特征 语音分析合成 LPC10 直接生成 LSTM
下载PDF
生成对抗网络在各领域应用研究进展 被引量:35
5
作者 刘建伟 谢浩杰 罗雄麟 《自动化学报》 EI CSCD 北大核心 2020年第12期2500-2536,共37页
随着深度学习的快速发展,生成式模型领域也取得了显著进展.生成对抗网络(Generative adversarial network,GAN)是一种无监督的学习方法,它是根据博弈论中的二人零和博弈理论提出的.GAN具有一个生成器网络和一个判别器网络,并通过对抗学... 随着深度学习的快速发展,生成式模型领域也取得了显著进展.生成对抗网络(Generative adversarial network,GAN)是一种无监督的学习方法,它是根据博弈论中的二人零和博弈理论提出的.GAN具有一个生成器网络和一个判别器网络,并通过对抗学习进行训练.近年来,GAN成为一个炙手可热的研究方向.GAN不仅在图像领域取得了不错的成绩,还在自然语言处理(Natural language processing,NLP)以及其他领域崭露头角.本文对GAN的基本原理、训练过程和传统GAN存在的问题进行了阐述,进一步详细介绍了通过损失函数的修改、网络结构的变化以及两者结合的手段提出的GAN变种模型的原理结构,其中包括:条件生成对抗网络(Conditional GAN,CGAN)、基于Wasserstein距离的生成对抗网络(Wasserstein-GAN,WGAN)及其基于梯度策略的WGAN(WGAN-gradient penalty,WGAN-GP)、基于互信息理论的生成对抗网络(Informational-GAN,InfoGAN)、序列生成对抗网络(Sequence GAN,SeqGAN)、Pix2Pix、循环一致生成对抗网络(Cycle-consistent GAN,Cycle GAN)及其增强Cycle-GAN(Augmented CycleGAN).概述了在计算机视觉、语音与NLP领域中基于GAN和相应GAN变种模型的基本原理结构,其中包括:基于CGAN的脸部老化应用(Face aging CGAN,Age-cGAN)、双路径生成对抗网络(Two-pathway GAN,TP-GAN)、表示解析学习生成对抗网络(Disentangled representation learning GAN,DR-GAN)、对偶学习生成对抗网络(DualGAN)、GeneGAN、语音增强生成对抗网络(Speech enhancement GAN,SEGAN)等.介绍了GAN在医学、数据增强等领域的应用情况,其中包括:数据增强生成对抗网络(Data augmentation GAN,DAGAN)、医学生成对抗网络(Medical GAN,MedGAN)、无监督像素级域自适应方法(Unsupervised pixel-level domain adaptation method,PixelDA).最后对GAN未来发展趋势及方向进行了展望. 展开更多
关键词 生成对抗网络 对抗学习 自然语言处理 计算机视觉 零和博弈 语音合成分析
下载PDF
我谈语文规范化
6
作者 王均 《语文建设》 CSSCI 北大核心 1995年第5期49-49,共1页
我谈语文规范化国家语委科研领导小组组长国家语委委员王均语言文字的规范化首先是语言的规范化。这就是宪法上写明的:“国家推广全国通用的变通话”现在已经到了信息社会的时代,一个现代国家没有一个全国通用的交际工具和标准统一的... 我谈语文规范化国家语委科研领导小组组长国家语委委员王均语言文字的规范化首先是语言的规范化。这就是宪法上写明的:“国家推广全国通用的变通话”现在已经到了信息社会的时代,一个现代国家没有一个全国通用的交际工具和标准统一的信息载体,是不可思议的。这不仅关系... 展开更多
关键词 语文规范化 语言规范化 推广普通话 少数民族 社会用字 语音分析合成 自然语言理解 文明形象 电子信件 学习和记忆
下载PDF
民族语文工作纪事(1992.12──1993.12)
7
作者 郭阳 《民族语文》 CSSCI 北大核心 1994年第4期78-80,34,共4页
民族语文工作纪事(1992.12──1993.12)郭阳1992年12月4日中国突厥语研究会与中央民族学院(现中央民族大学)民语二系联合召开学术交流会。突厥语研究会副会长胡振华教授作了题为“两度访问中亚”的学术报告,... 民族语文工作纪事(1992.12──1993.12)郭阳1992年12月4日中国突厥语研究会与中央民族学院(现中央民族大学)民语二系联合召开学术交流会。突厥语研究会副会长胡振华教授作了题为“两度访问中亚”的学术报告,就中亚各国有关突厥语研究发展方向和... 展开更多
关键词 民族语文 突厥语 中国少数民族语言 中央民族学院 文化学术交流 民族研究 中国社会科学院 黑龙江省 语音分析合成 云南省
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部