期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
声音转换技术的研究与进展 被引量:32
1
作者 左国玉 刘文举 阮晓钢 《电子学报》 EI CAS CSCD 北大核心 2004年第7期1165-1172,共8页
声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声... 声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声音特点 .本文介绍了当前声音转换技术领域的研究状态 ,主要分析现有声音转换技术中各种转换算法的实现原理 ,描述声音转换系统性能的各种评估方法 。 展开更多
关键词 声音转换 语音频谱 基频曲线 声门激励 码本映射 人工神经网络 高斯混合模型 隐马尔科夫模型
下载PDF
基于隐马尔可夫模型和高斯混合模型结合的声音转换方法 被引量:5
2
作者 岳振军 邹翔 王浩 《数据采集与处理》 CSCD 北大核心 2009年第3期285-289,共5页
针对隐马尔可夫模型较强的语音信号表征能力和高斯混合模型良好的声音转换效果,提出了一种了隐马尔可夫模型和高斯混合模型相结合转换线谱频率的方法,给出了理论推导和算法流程,并利用高斯建模实现了韵律特征的转换。利用所述算法对录... 针对隐马尔可夫模型较强的语音信号表征能力和高斯混合模型良好的声音转换效果,提出了一种了隐马尔可夫模型和高斯混合模型相结合转换线谱频率的方法,给出了理论推导和算法流程,并利用高斯建模实现了韵律特征的转换。利用所述算法对录制的两段语音进行了仿真实验,转换语音有较好的自然度和清晰度,ABX测试结果显示,文中算法得到的语音在听觉上有90.2%的概率更接近目标说话人语音。 展开更多
关键词 声音转换 线谱频率 隐马尔可夫模型 高斯混合模型 主观评价
下载PDF
基于遗传径向基神经网络的声音转换 被引量:3
3
作者 左国玉 刘文举 阮晓钢 《中文信息学报》 CSCD 北大核心 2004年第1期78-84,共7页
声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式 ,使转换语音保持源说话人原有语音信息内容不变 ,而具有目标说话人的声音特点。本文研究了由遗传算法训练的RBF神经网络捕获说话人的语音频谱包络映射关系 ,... 声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式 ,使转换语音保持源说话人原有语音信息内容不变 ,而具有目标说话人的声音特点。本文研究了由遗传算法训练的RBF神经网络捕获说话人的语音频谱包络映射关系 ,以实现不同说话人之间声音特性的转换。实验对六个普通话单元音音素的转换语音质量分别作了客观和主观评估 ,结果表明用神经网络方法可以获得所期望的转换语音性能。实验结果还说明 ,与K -均值法相比 ,用遗传算法训练神经网络可以增强网络的全局寻优能力 ,使转换语音与目标语音的平均频谱失真距离减小约 10 %。 展开更多
关键词 人工智能 自然语言处理 声音转换 RBF神经网络 遗传算法 线谱频
下载PDF
基于分类线性加权的源-目标话者声音转换算法的研究 被引量:1
4
作者 张剑 戴蓓蒨 +2 位作者 孙俊 陆伟 李辉 《电路与系统学报》 CSCD 北大核心 2008年第3期106-110,105,共6页
源-目标话者的声音转换是一种变换说话人声音特性的技术,它将源说话人的声音转换成另一个指定的目标说话人的声音。对源话者声道谱特性的修改是声音转换的关键之一。为了克服一般分类线性转换算法中分类不准确所带来的误差,本文引入了... 源-目标话者的声音转换是一种变换说话人声音特性的技术,它将源说话人的声音转换成另一个指定的目标说话人的声音。对源话者声道谱特性的修改是声音转换的关键之一。为了克服一般分类线性转换算法中分类不准确所带来的误差,本文引入了分类线性加权转换的策略,根据不同子类的转换函数对谱特性的贡献,赋予不同的加权系数,给出了一种基于GMM后验概率加权的线性转换算法。在微软汉语普通话语音数据库上做的四组对比实验表明,该算法在谱转换性能上均有不同程度的提高。 展开更多
关键词 声音转换 源-目标话者 声道谱转换 高斯混合模型 分类线性转换 分类线性加权转换
下载PDF
一种使用声调映射码本的汉语声音转换方法 被引量:4
5
作者 左国玉 刘文举 阮晓钢 《数据采集与处理》 CSCD 北大核心 2005年第2期144-149,共6页
在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成... 在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。 展开更多
关键词 声音转换 声调映射码本 混合高斯映射
下载PDF
支持向量回归在声音转换中的应用 被引量:1
6
作者 符敏 程德福 《电声技术》 2006年第3期45-48,共4页
声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。将3种不同的回归方法:多项式回归,线性多变量回归以及支持向量回归分别应用于声音转换。实验分别对5个普通话元音进行转换。主观和客观评估了每种方法的语音转换... 声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。将3种不同的回归方法:多项式回归,线性多变量回归以及支持向量回归分别应用于声音转换。实验分别对5个普通话元音进行转换。主观和客观评估了每种方法的语音转换质量。结果表明,支持向量回归具有更强的学习能力,使转换语音具有更好的目标倾向性。与多项式回归和线性多变量回归相比,支持向量回归既提高了泛化能力又避免了频谱不连续性,使转换语音与目标语音的频谱距离失真分别减少了33.29%和35.24%。 展开更多
关键词 多项式回归 线性多变量回归 支持向量回归 声音转换
下载PDF
基于共振峰参数和分类线性加权的源-目标声音转换
7
作者 王海祥 戴蓓蒨 +1 位作者 陆伟 张剑 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第11期1153-1159,共7页
源-目标说话人声音转换是一种变换说话人声音特征的技术,它将源说话人的声音转换成目标说话人的声音.其中,声道参数的转换是获得高质量重建语音的关键,所以选择声道共振峰参数作为待转换的特征参数,利用线性预测求根法提取共振峰参数.... 源-目标说话人声音转换是一种变换说话人声音特征的技术,它将源说话人的声音转换成目标说话人的声音.其中,声道参数的转换是获得高质量重建语音的关键,所以选择声道共振峰参数作为待转换的特征参数,利用线性预测求根法提取共振峰参数.为了克服分类线性转换算法(CLT)中分类不准带来的误差,引入了分类线性加权转换的策略,给出了一种基于径向基函数神经网络的分类线性加权转换算法(WCLT).在微软汉语普通话语音数据库上对转换语音分别作了客观和主观评估,验证了分类数目和训练集对两种转换算法的影响.实验结果表明,WCLT算法的转换效果优于CLT算法,一定程度上克服了高斯混合模型的转换算法(GMM)转换语音时,频谱过分光滑的现象,并在只有较少训练集数据时也能得到较好的转换效果. 展开更多
关键词 声音转换 共振峰参数 径向基函数神经网络 分类线性转换 分类线性加权转换
下载PDF
声音转换实验系统的研究与实现
8
作者 刘金凤 符敏 程德福 《南京理工大学学报(社会科学版)》 CAS 2005年第S1期217-220,共4页
声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法... 声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法合成转换语音。实验中对5个国际音标与语音中的元音进行转换,并使用MFCC听觉倒谱法对转换结果进行评估,其中男声到女声的转换后的语音到目标语音的MFCC距离比源语音到目标语音MFCC距离平均减小48.8%。 展开更多
关键词 声音转换 矢量量化 代码映射 语音合成
下载PDF
声音转换及相关技术的研究 被引量:1
9
作者 潘渊 《今日科苑》 2010年第22期113-113,共1页
声音转换就是将一个人的声音信号进行转换,使其听起来像另一个人说话的声音。声音转换的用途很广泛;声音转换需要训练阶段和转换阶段两大步骤;对于每种声音转换都可以从客观和主观上评价其性能。
关键词 声音转换 训练过程 转换过程 性能评价
下载PDF
现代汽车集团将车内外声音转换为图像和振动,为听障驾驶员服务
10
《汽车零部件》 2019年第1期76-76,共1页
现代汽车集团(Hyundai Motor Group)推出一项创新技术,可为听障驾驶员提供帮助。听障驾驶员主要依靠视觉和触觉进行操作,现代汽车集团通过触觉和视觉方式将结合车内和车外声音,为听障驾驶员创造了一种交流方式,无论驾驶员身体有什么局限... 现代汽车集团(Hyundai Motor Group)推出一项创新技术,可为听障驾驶员提供帮助。听障驾驶员主要依靠视觉和触觉进行操作,现代汽车集团通过触觉和视觉方式将结合车内和车外声音,为听障驾驶员创造了一种交流方式,无论驾驶员身体有什么局限性,都可扩大其出行自由度。 展开更多
关键词 汽车集团 驾驶员 声音转换 车内 HYUNDAI 振动 图像 服务
下载PDF
声音转换器与盲文显示器
11
作者 林美 《科学之友》 2001年第9期41-41,共1页
要盲人利用电脑作文字处理似乎是天方夜谭。然而,在新近发明的专用设备的帮助下,盲人完全可以通过听觉来完成文字处理工作。在电脑技术渗透到各行各业的同时,盲人并未成为被遗忘的人群。对盲人来说,键盘输入倒不成问题,问题在于如何读... 要盲人利用电脑作文字处理似乎是天方夜谭。然而,在新近发明的专用设备的帮助下,盲人完全可以通过听觉来完成文字处理工作。在电脑技术渗透到各行各业的同时,盲人并未成为被遗忘的人群。对盲人来说,键盘输入倒不成问题,问题在于如何读出电脑屏上显示的信息,这是盲人使用电脑的最大障碍。美国盲人联合会专门雇用了两名盲人电脑专家,负责设计、研制帮助盲人使用电脑的器材和软件。目前。 展开更多
关键词 声音转换 盲文显示器 听觉 文字处理 计算机
下载PDF
基于音素绑定码本映射的说话人声音转换方法 被引量:1
12
作者 王子祥 戴礼荣 +1 位作者 王玉平 王仁华 《模式识别与人工智能》 EI CSCD 北大核心 2006年第3期300-306,共7页
介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问... 介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问题,本文提出基于音素绑定的码本加权叠加方法来完成语音谱的转换,同时利用决策树来完成韵律的转换.实验表明,即使在数据量较少的情况下,该方法也能较好地完成说话人声音转换,并能得到较高的语音音质. 展开更多
关键词 声音转换 码本映射 决策树
原文传递
立体声声音数模转换器的应用
13
作者 杜尚 《电子产品世界》 1998年第4期88-88,共1页
PCM1725是一种完整的廉价立体声声音数模转换器(DAC),在256fs(fs是声音取样频率,典型值是32kHz、441kHz或48kHz)或384fs系统时钟下工作。该DAC包括一种三阶Δ调制器、数字内插滤波... PCM1725是一种完整的廉价立体声声音数模转换器(DAC),在256fs(fs是声音取样频率,典型值是32kHz、441kHz或48kHz)或384fs系统时钟下工作。该DAC包括一种三阶Δ调制器、数字内插滤波器和模拟输出放大器。PCM1725... 展开更多
关键词 立体声 声音数模转换 DAC
下载PDF
基于GMM和概率修正码本的源-目标说话人声门波转换 被引量:2
14
作者 孙俊 戴蓓蒨 张剑 《数据采集与处理》 CSCD 北大核心 2007年第1期19-24,共6页
提出了一种用于源-目标说话人声门波导数参数转换的、基于勒让德正交分解的声门波导数波形参数提取方法。该方法将声门波导数波形在6维正交勒让德坐标系中的投影构成了描述其形状的特征矢量,并采用基于GMM的概率分类加权转换算法,使每... 提出了一种用于源-目标说话人声门波导数参数转换的、基于勒让德正交分解的声门波导数波形参数提取方法。该方法将声门波导数波形在6维正交勒让德坐标系中的投影构成了描述其形状的特征矢量,并采用基于GMM的概率分类加权转换算法,使每个特征矢量的转换规则可由多个类所对应的规则的线性加权组合得到,可以使转换性能得到较大的提高。在此基础上,又给出了一种基于GMM的声门波导数波形的码本修正算法,以弥补声门波导数波形参数化而损失的含有说话人个性特征的高频送气分量和波纹分量。实验结果表明,本文方法转换性能明显好于基于矢量量化(VQ)的码本映射算法。 展开更多
关键词 声音转换 声门波导数 勒让德正交分解 高斯混合模型(GMM) 概率加权修正码本
下载PDF
基于Legendre正交分解的源-目标说话人声门波导数转换
15
作者 孙俊 于俊朋 戴蓓蒨 《小型微型计算机系统》 CSCD 北大核心 2009年第5期1021-1024,共4页
使用一种不需要精确的声门关闭期间(GCI)信息便可求出声门波的方法,该方法通过在一个基音同步帧中搜索到一个最平滑的线性预测分析逆滤波的残差信号,从而得到一个没有激励影响的声道参数,间接的获得了GCI,因而可以获得比较精确的声门波... 使用一种不需要精确的声门关闭期间(GCI)信息便可求出声门波的方法,该方法通过在一个基音同步帧中搜索到一个最平滑的线性预测分析逆滤波的残差信号,从而得到一个没有激励影响的声道参数,间接的获得了GCI,因而可以获得比较精确的声门波导数波形.在此基础上提出了一种基于勒让德正交多项式的声门波导数参数提取方法,将声门波导数波形的n维勒让德正交空间的坐标组成一个特征矢量作相应转换,此方法去除了特征矢量中各维参数间的相关性,并且矢量间的欧氏距离表示了声门波导数波形间的相似度,因而聚类及其转换效果要优于多项式特征参数.在微软语音库上作的相关一系列对比实验表明,相对于多项式拟合系数特征参数基于VQ码本映射方法的基准系统,本文提出的方法的帧平均互相关系数提高了11.92%. 展开更多
关键词 声音转换 声门波导数 多项式拟合 勒让德正交多项式
下载PDF
磁带转换一点通
16
作者 小富贵 《电脑》 2004年第12期132-132,共1页
关键词 磁带 电脑 音频工具 播放 声音转换 保存 相声
下载PDF
用单片机制作机器人声音模仿器
17
作者 电路飞翔 《电子制作》 2008年第9期33-34,共2页
利用单片机可以制作一个模仿器实时地将人说话的声音转换成机器人的音调,本文介绍了如何使用ATtiny45单片机完成这个简易而有趣电路的制作。在动画片《星际大争霸》中的Cylon人发出的声音就是我们经常能听到的机器人声。我们可以设计... 利用单片机可以制作一个模仿器实时地将人说话的声音转换成机器人的音调,本文介绍了如何使用ATtiny45单片机完成这个简易而有趣电路的制作。在动画片《星际大争霸》中的Cylon人发出的声音就是我们经常能听到的机器人声。我们可以设计一个简洁的电路来将正常人发出的声音“装饰”成这种声音,在单片机的帮助下,这个设计可以非常容易实现。 展开更多
关键词 声音转换 单片机 机器人 制作 模仿 动画片 电路 人发
下载PDF
韩科学家发明用声音充电装置
18
《机械》 2011年第S1期164-164,共1页
韩国科学家研制出一种装置,允许手机在通话的同时充电。这项技术能够将声音转换成电,通话的声音越大,充电越多。对于那些经常因为电量耗尽而倍感挫折的手机用户来说,这项发明无疑是一个"天赐之物"。
关键词 科学家 声音转换 电池充电 充电装置 手机用户 发明 通话 研制 氧化锌 电量
下载PDF
科学家发明声音充电装置
19
《发明与创新(大科技)》 2011年第7期27-27,共1页
韩国科学家研制出一种装置,允许手机在通话的同时充电。这项技术能够将声音转换成电,通话的声音越大,充电越多。然而,人们对这种装置也产生担忧,理由就是一些不顾他人感受的手机用户会在公众场合制造更令人难以忍受的噪音,为手机充电。... 韩国科学家研制出一种装置,允许手机在通话的同时充电。这项技术能够将声音转换成电,通话的声音越大,充电越多。然而,人们对这种装置也产生担忧,理由就是一些不顾他人感受的手机用户会在公众场合制造更令人难以忍受的噪音,为手机充电。除了手机外,这项技术也可用于为私人音乐播放器充电,做到娱乐和充电两不误。 展开更多
关键词 充电装置 声音转换 科学家 发明 手机用户 音乐播放器 手机充电 通话
下载PDF
基于深度神经网络的汉语语音合成的研究 被引量:10
20
作者 王坚 张媛媛 《计算机科学》 CSCD 北大核心 2015年第S1期75-78,共4页
为了提高基于HMM的语音合成的音质,探讨了不同的结构和参数对深度神经网络(DNN)训练的影响,并证明了DNN判别S/U/V的有效性;完成了DNN对HMM合成系统的合成语音谱参向原始语音进行转换。进一步地,探讨了对暂时分解(TD)算法得到的参数进行... 为了提高基于HMM的语音合成的音质,探讨了不同的结构和参数对深度神经网络(DNN)训练的影响,并证明了DNN判别S/U/V的有效性;完成了DNN对HMM合成系统的合成语音谱参向原始语音进行转换。进一步地,探讨了对暂时分解(TD)算法得到的参数进行转换的方案,对TD分解得到的事件向量进行DNN训练,建立转换模型,并同未转换的事件函数进行再合成。实验证明,用DNN转换合成后的频谱更接近原始频谱;主观评测表明,该方法能有效地改善合成语音的音质。 展开更多
关键词 HTS DNN 深度学习 声音转换 暂时分解
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部