期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
分段语音时长规整算法 被引量:4
1
作者 黄昊 郭立 郑东飞 《声学技术》 CSCD 北大核心 2007年第6期1191-1195,共5页
一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱... 一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱变化快慢和能量大小将语音划分为感知敏感,非敏感和次敏感部分,对各部分采用不同压扩比进行同步叠加的分段时长规整算法,希望能够提高合成语音质量。实验证明该算法在压扩程度高、低采样率时对语音质量有显著改善。 展开更多
关键词 语音处理 时长规整 同步叠加 梅尔倒谱系数
下载PDF
一种快速实时语音个人特征改变方法 被引量:2
2
作者 毛启容 詹永照 杜守富 《电子与信息学报》 EI CSCD 北大核心 2007年第2期434-438,共5页
为保护实时语音通信中的个人特征,该文提出了一种新的实时语音个人特征改变方法,该方法采用PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改,从而实现... 为保护实时语音通信中的个人特征,该文提出了一种新的实时语音个人特征改变方法,该方法采用PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改,从而实现语音信号个人特征的改变;此外,针对目前时长规整大多采用的同步叠加(SOLA)算法计算量大、不适合实时语音处理的缺点,采用课题组提出的一种新的基于同步叠加方法的时长规整算法——自适应同步叠加(ASOLA)算法,对个人特征改变后的语音信号进行时间上的弥补,保证语音处理的实时性。最后,利用该方法实现了实时语音的隐私保护。实验结果表明,该方法合成的语音质量高、实时性好。 展开更多
关键词 语音改变 隐私保护 音高规整 时长规整 实时
下载PDF
基于共振峰合成和韵律调整的语音验证码方法研究 被引量:4
3
作者 汪成亮 张玉维 《计算机应用研究》 CSCD 北大核心 2011年第7期2458-2461,共4页
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使... 为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。 展开更多
关键词 语音合成 验证码 共振峰合成 韵律调整 时长规整
下载PDF
基于感知敏感成分划分的语音时长规整算法 被引量:4
4
作者 黄昊 郭立 李琳 《数据采集与处理》 CSCD 北大核心 2008年第6期740-745,共6页
一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音... 一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音中的瞬态成分、稳态成分和安静成分,再对各部分采用不同压扩比进行同步叠加的时长规整算法。对语音信号的感知敏感成分压扩较小,希望能够提高合成语音质量。实验证明本方法对低采样率合成语音质量有显著改善,在低码率语音编码中可以有效提高编码效率。 展开更多
关键词 语音处理 时长规整 同步叠加 瞬态成分 梅尔倒谱系数
下载PDF
基于重心的抗同步攻击的音频水印算法 被引量:1
5
作者 黄雄华 王宏霞 +1 位作者 蒋伟贞 崔更申 《自动化学报》 EI CSCD 北大核心 2013年第8期1321-1329,共9页
抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成... 抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成的水印由混沌序列加密后以量化的方法嵌入载体音频三级小波近似分量均值中.为了降低同步攻击后同步位置的连续偏移,水印嵌入提取过程采用了均匀分帧的方法.实验结果表明提出的算法能抵抗常规信号处理操作,同时能抵抗20%的TSM操作(包含音调不变TSM和重采样操作)和1/10的抖动操作,有很好的鲁棒性. 展开更多
关键词 音频水印 相对重心 tsm 均匀分帧
下载PDF
基于发音机制的贪婪自适应语音时长规整算法
6
作者 杨燕 雷颖思 岳辉 《计算机工程》 CAS CSCD 北大核心 2015年第8期212-217,共6页
语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规... 语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规整因子,动态改变规整因子,进一步改进整体规整比例缺陷,从而设计贪婪自适应语音时长规整算法。在Matlab环境下对TIMIT语音库进行语音对比的结果表明,与波形相似同步叠加算法、时域基音同步叠加算法相比,该算法能提高合成语音的自然度,减小规整时长误差。 展开更多
关键词 语音时长规整 规整因子 同步叠加算法 自适应算法 贪婪自适应算法
下载PDF
基于正弦模型的汉语文—语转换系统
7
作者 沙泉 《上海应用技术学院学报(自然科学版)》 2001年第2期118-121,共4页
针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音... 针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。将该方法应用于汉语文语转换系统中 。 展开更多
关键词 正弦模型 时长修正 音高修正 文—语转换
下载PDF
语音时长调整快速算法 被引量:1
8
作者 莫双燕 关海欣 郑可欣 《声学技术》 CSCD 2010年第5期507-511,共5页
针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性... 针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性原则),在保证语音质量不降低的同时,大幅减少冗余的计算量,实验结果表明,该方法调整后的语音质量高、计算速度快,通过与原始算法的对比证明了以上结论,该方法能广泛应用于实际中,尤其是应用于实时性要求较高的场合。 展开更多
关键词 语音 时长调整 快速算法
下载PDF
应用于短时语音语种识别的时长扩展方法 被引量:7
9
作者 苗晓晓 张健 +2 位作者 索宏彬 周若华 颜永红 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第3期254-259,共6页
为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换... 为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音;其次,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音;最后,送入语种识别系统进行识别。实验结果表明:所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能。 展开更多
关键词 语种识别 短时 时域伸缩 语速
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部