期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
分段语音时长规整算法
被引量:
4
1
作者
黄昊
郭立
郑东飞
《声学技术》
CSCD
北大核心
2007年第6期1191-1195,共5页
一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱...
一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱变化快慢和能量大小将语音划分为感知敏感,非敏感和次敏感部分,对各部分采用不同压扩比进行同步叠加的分段时长规整算法,希望能够提高合成语音质量。实验证明该算法在压扩程度高、低采样率时对语音质量有显著改善。
展开更多
关键词
语音处理
时长规整
同步叠加
梅尔倒谱系数
下载PDF
职称材料
一种快速实时语音个人特征改变方法
被引量:
2
2
作者
毛启容
詹永照
杜守富
《电子与信息学报》
EI
CSCD
北大核心
2007年第2期434-438,共5页
为保护实时语音通信中的个人特征,该文提出了一种新的实时语音个人特征改变方法,该方法采用PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改,从而实现...
为保护实时语音通信中的个人特征,该文提出了一种新的实时语音个人特征改变方法,该方法采用PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改,从而实现语音信号个人特征的改变;此外,针对目前时长规整大多采用的同步叠加(SOLA)算法计算量大、不适合实时语音处理的缺点,采用课题组提出的一种新的基于同步叠加方法的时长规整算法——自适应同步叠加(ASOLA)算法,对个人特征改变后的语音信号进行时间上的弥补,保证语音处理的实时性。最后,利用该方法实现了实时语音的隐私保护。实验结果表明,该方法合成的语音质量高、实时性好。
展开更多
关键词
语音改变
隐私保护
音高规整
时长规整
实时
下载PDF
职称材料
基于共振峰合成和韵律调整的语音验证码方法研究
被引量:
4
3
作者
汪成亮
张玉维
《计算机应用研究》
CSCD
北大核心
2011年第7期2458-2461,共4页
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使...
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。
展开更多
关键词
语音合成
验证码
共振峰合成
韵律调整
时长规整
下载PDF
职称材料
基于感知敏感成分划分的语音时长规整算法
被引量:
4
4
作者
黄昊
郭立
李琳
《数据采集与处理》
CSCD
北大核心
2008年第6期740-745,共6页
一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音...
一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音中的瞬态成分、稳态成分和安静成分,再对各部分采用不同压扩比进行同步叠加的时长规整算法。对语音信号的感知敏感成分压扩较小,希望能够提高合成语音质量。实验证明本方法对低采样率合成语音质量有显著改善,在低码率语音编码中可以有效提高编码效率。
展开更多
关键词
语音处理
时长规整
同步叠加
瞬态成分
梅尔倒谱系数
下载PDF
职称材料
基于重心的抗同步攻击的音频水印算法
被引量:
1
5
作者
黄雄华
王宏霞
+1 位作者
蒋伟贞
崔更申
《自动化学报》
EI
CSCD
北大核心
2013年第8期1321-1329,共9页
抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成...
抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成的水印由混沌序列加密后以量化的方法嵌入载体音频三级小波近似分量均值中.为了降低同步攻击后同步位置的连续偏移,水印嵌入提取过程采用了均匀分帧的方法.实验结果表明提出的算法能抵抗常规信号处理操作,同时能抵抗20%的TSM操作(包含音调不变TSM和重采样操作)和1/10的抖动操作,有很好的鲁棒性.
展开更多
关键词
音频水印
相对重心
tsm
均匀分帧
下载PDF
职称材料
基于发音机制的贪婪自适应语音时长规整算法
6
作者
杨燕
雷颖思
岳辉
《计算机工程》
CAS
CSCD
北大核心
2015年第8期212-217,共6页
语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规...
语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规整因子,动态改变规整因子,进一步改进整体规整比例缺陷,从而设计贪婪自适应语音时长规整算法。在Matlab环境下对TIMIT语音库进行语音对比的结果表明,与波形相似同步叠加算法、时域基音同步叠加算法相比,该算法能提高合成语音的自然度,减小规整时长误差。
展开更多
关键词
语音时长规整
规整因子
同步叠加算法
自适应算法
贪婪自适应算法
下载PDF
职称材料
基于正弦模型的汉语文—语转换系统
7
作者
沙泉
《上海应用技术学院学报(自然科学版)》
2001年第2期118-121,共4页
针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音...
针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。将该方法应用于汉语文语转换系统中 。
展开更多
关键词
正弦模型
时长修正
音高修正
文—语转换
下载PDF
职称材料
语音时长调整快速算法
被引量:
1
8
作者
莫双燕
关海欣
郑可欣
《声学技术》
CSCD
2010年第5期507-511,共5页
针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性...
针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性原则),在保证语音质量不降低的同时,大幅减少冗余的计算量,实验结果表明,该方法调整后的语音质量高、计算速度快,通过与原始算法的对比证明了以上结论,该方法能广泛应用于实际中,尤其是应用于实时性要求较高的场合。
展开更多
关键词
语音
时长调整
快速算法
下载PDF
职称材料
应用于短时语音语种识别的时长扩展方法
被引量:
7
9
作者
苗晓晓
张健
+2 位作者
索宏彬
周若华
颜永红
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第3期254-259,共6页
为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换...
为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音;其次,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音;最后,送入语种识别系统进行识别。实验结果表明:所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能。
展开更多
关键词
语种识别
短时
时域伸缩
语速
原文传递
题名
分段语音时长规整算法
被引量:
4
1
作者
黄昊
郭立
郑东飞
机构
中国科学技术大学电子科学与技术系
出处
《声学技术》
CSCD
北大核心
2007年第6期1191-1195,共5页
基金
安徽省自然科学基金(050420102)
文摘
一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱变化快慢和能量大小将语音划分为感知敏感,非敏感和次敏感部分,对各部分采用不同压扩比进行同步叠加的分段时长规整算法,希望能够提高合成语音质量。实验证明该算法在压扩程度高、低采样率时对语音质量有显著改善。
关键词
语音处理
时长规整
同步叠加
梅尔倒谱系数
Keywords
speech
signal processing
time
-
scale
modification
SOLA
MFCC
分类号
TB556 [理学—声学]
下载PDF
职称材料
题名
一种快速实时语音个人特征改变方法
被引量:
2
2
作者
毛启容
詹永照
杜守富
机构
江苏大学计算机科学与通信工程学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2007年第2期434-438,共5页
基金
国家自然科学基金(60273040)
江苏省青蓝工程(1191170004)
江苏大学青年科学基金(1241170005)资助课题
文摘
为保护实时语音通信中的个人特征,该文提出了一种新的实时语音个人特征改变方法,该方法采用PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改,从而实现语音信号个人特征的改变;此外,针对目前时长规整大多采用的同步叠加(SOLA)算法计算量大、不适合实时语音处理的缺点,采用课题组提出的一种新的基于同步叠加方法的时长规整算法——自适应同步叠加(ASOLA)算法,对个人特征改变后的语音信号进行时间上的弥补,保证语音处理的实时性。最后,利用该方法实现了实时语音的隐私保护。实验结果表明,该方法合成的语音质量高、实时性好。
关键词
语音改变
隐私保护
音高规整
时长规整
实时
Keywords
speech
modification
Privacy protection
Pitch-
scale
time
-
scale
Real-
time
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于共振峰合成和韵律调整的语音验证码方法研究
被引量:
4
3
作者
汪成亮
张玉维
机构
重庆大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2011年第7期2458-2461,共4页
基金
国家自然科学基金资助项目(61004112)
中国博士后科学基金资助项目(20080430750)
文摘
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。
关键词
语音合成
验证码
共振峰合成
韵律调整
时长规整
Keywords
speech
synthesis
CAPTCHA
formant synthesis
prosody adjustment
time
scale
modification
分类号
TN912.33 [电子电信—通信与信息系统]
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于感知敏感成分划分的语音时长规整算法
被引量:
4
4
作者
黄昊
郭立
李琳
机构
中国科学技术大学电子科学与技术系
出处
《数据采集与处理》
CSCD
北大核心
2008年第6期740-745,共6页
基金
国家自然科学基金(60772031)资助项目
安徽省自然科学基金(050420102)资助项目
文摘
一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音中的瞬态成分、稳态成分和安静成分,再对各部分采用不同压扩比进行同步叠加的时长规整算法。对语音信号的感知敏感成分压扩较小,希望能够提高合成语音质量。实验证明本方法对低采样率合成语音质量有显著改善,在低码率语音编码中可以有效提高编码效率。
关键词
语音处理
时长规整
同步叠加
瞬态成分
梅尔倒谱系数
Keywords
speech
signal processing
time
-
scale
modification
synchronous overlap and add (SOLA)
transient portion
Mel-frequency cepstral eoefficient (MFCC)
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于重心的抗同步攻击的音频水印算法
被引量:
1
5
作者
黄雄华
王宏霞
蒋伟贞
崔更申
机构
西南交通大学信息科学与技术学院
桂林电子科技大学广西可信软件重点实验室
暨南大学信息科学技术学院
出处
《自动化学报》
EI
CSCD
北大核心
2013年第8期1321-1329,共9页
文摘
抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成的水印由混沌序列加密后以量化的方法嵌入载体音频三级小波近似分量均值中.为了降低同步攻击后同步位置的连续偏移,水印嵌入提取过程采用了均匀分帧的方法.实验结果表明提出的算法能抵抗常规信号处理操作,同时能抵抗20%的TSM操作(包含音调不变TSM和重采样操作)和1/10的抖动操作,有很好的鲁棒性.
关键词
音频水印
相对重心
tsm
均匀分帧
Keywords
Audio watermarking, normalized gravity of center,
time
scale
modification
(tsm
), dividing frame evenly
分类号
TP309.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于发音机制的贪婪自适应语音时长规整算法
6
作者
杨燕
雷颖思
岳辉
机构
兰州交通大学电子与信息工程学院
兰州交通大学铁道技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第8期212-217,共6页
基金
甘肃省科技厅自然科学基金资助项目(1310RJZA050)
甘肃省高等学校基本科研业务费专项基金资助项目(214138)
文摘
语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规整因子,动态改变规整因子,进一步改进整体规整比例缺陷,从而设计贪婪自适应语音时长规整算法。在Matlab环境下对TIMIT语音库进行语音对比的结果表明,与波形相似同步叠加算法、时域基音同步叠加算法相比,该算法能提高合成语音的自然度,减小规整时长误差。
关键词
语音时长规整
规整因子
同步叠加算法
自适应算法
贪婪自适应算法
Keywords
speech time scale modification(tsm)
modification
factor
Synchronized Overlap-add(SOLA) algorithm
adaptive algorithm
greedy adaptive algorithm
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于正弦模型的汉语文—语转换系统
7
作者
沙泉
机构
上海应用技术学院自动化工程系
出处
《上海应用技术学院学报(自然科学版)》
2001年第2期118-121,共4页
文摘
针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。将该方法应用于汉语文语转换系统中 。
关键词
正弦模型
时长修正
音高修正
文—语转换
Keywords
sinusoidal model
time
scale
modification
pitch
scale
modification
text to
speech
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
语音时长调整快速算法
被引量:
1
8
作者
莫双燕
关海欣
郑可欣
机构
法源司法科学证据鉴定中心声像部
出处
《声学技术》
CSCD
2010年第5期507-511,共5页
基金
广西科学基金资助项目(0639028)
文摘
针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性原则),在保证语音质量不降低的同时,大幅减少冗余的计算量,实验结果表明,该方法调整后的语音质量高、计算速度快,通过与原始算法的对比证明了以上结论,该方法能广泛应用于实际中,尤其是应用于实时性要求较高的场合。
关键词
语音
时长调整
快速算法
Keywords
speech
time
-
scale
modification
fast algorithm
speed and quality
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
应用于短时语音语种识别的时长扩展方法
被引量:
7
9
作者
苗晓晓
张健
索宏彬
周若华
颜永红
机构
中国科学院声学研究所语言声学与内容理解重点实验室
中国科学院大学
中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第3期254-259,共6页
基金
国家重点研发计划重点专项(2016YFB0801203,2016YFB0801200)
国家自然科学基金资助项目(11590770-4,U1536117,11504406,11461141004)
文摘
为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音;其次,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音;最后,送入语种识别系统进行识别。实验结果表明:所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能。
关键词
语种识别
短时
时域伸缩
语速
Keywords
language recognition
short-duration
time
scale
modification
speech
rate
分类号
TN912.3 [电子电信—通信与信息系统]
原文传递
题名
作者
出处
发文年
被引量
操作
1
分段语音时长规整算法
黄昊
郭立
郑东飞
《声学技术》
CSCD
北大核心
2007
4
下载PDF
职称材料
2
一种快速实时语音个人特征改变方法
毛启容
詹永照
杜守富
《电子与信息学报》
EI
CSCD
北大核心
2007
2
下载PDF
职称材料
3
基于共振峰合成和韵律调整的语音验证码方法研究
汪成亮
张玉维
《计算机应用研究》
CSCD
北大核心
2011
4
下载PDF
职称材料
4
基于感知敏感成分划分的语音时长规整算法
黄昊
郭立
李琳
《数据采集与处理》
CSCD
北大核心
2008
4
下载PDF
职称材料
5
基于重心的抗同步攻击的音频水印算法
黄雄华
王宏霞
蒋伟贞
崔更申
《自动化学报》
EI
CSCD
北大核心
2013
1
下载PDF
职称材料
6
基于发音机制的贪婪自适应语音时长规整算法
杨燕
雷颖思
岳辉
《计算机工程》
CAS
CSCD
北大核心
2015
0
下载PDF
职称材料
7
基于正弦模型的汉语文—语转换系统
沙泉
《上海应用技术学院学报(自然科学版)》
2001
0
下载PDF
职称材料
8
语音时长调整快速算法
莫双燕
关海欣
郑可欣
《声学技术》
CSCD
2010
1
下载PDF
职称材料
9
应用于短时语音语种识别的时长扩展方法
苗晓晓
张健
索宏彬
周若华
颜永红
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
7
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部