期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于正弦模型的汉语语音时长和音高的修正
1
作者 周江扬 柴佩琪 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第3期312-316,共5页
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整 ,可调范围比较大 ,而且保证了合成语音的清晰度与自然度 .非正式测听结果表明 :该算法是一种很适合汉语语音的韵律调整的算法 .
关键词 正弦模型 基音同步 频率匹配 韵律修正 汉语语音 时长修正 音高修正 语音信号处理
下载PDF
一种调整汉语语速的新方法 被引量:2
2
作者 沙泉 周江扬 《计算机工程与科学》 CSCD 2000年第4期64-66,共3页
本文针对 PSOL A算法会引起频域上的不连续 ,提出了一种汉语语速调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速的调整 ,实验结果证明 ,合成的语音信号... 本文针对 PSOL A算法会引起频域上的不连续 ,提出了一种汉语语速调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。 展开更多
关键词 时长修正 汉语语速 语音信号 语音合成
下载PDF
基于正弦模型的汉语文—语转换系统
3
作者 沙泉 《上海应用技术学院学报(自然科学版)》 2001年第2期118-121,共4页
针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音... 针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。将该方法应用于汉语文语转换系统中 。 展开更多
关键词 正弦模型 时长修正 音高修正 文—语转换
下载PDF
Emotional speaker recognition based on prosody transformation 被引量:1
4
作者 宋鹏 赵力 邹采荣 《Journal of Southeast University(English Edition)》 EI CAS 2011年第4期357-360,共4页
A novel emotional speaker recognition system (ESRS) is proposed to compensate for emotion variability. First, the emotion recognition is adopted as a pre-processing part to classify the neutral and emotional speech.... A novel emotional speaker recognition system (ESRS) is proposed to compensate for emotion variability. First, the emotion recognition is adopted as a pre-processing part to classify the neutral and emotional speech. Then, the recognized emotion speech is adjusted by prosody modification. Different methods including Gaussian normalization, the Gaussian mixture model (GMM) and support vector regression (SVR) are adopted to define the mapping rules of F0s between emotional and neutral speech, and the average linear ratio is used for the duration modification. Finally, the modified emotional speech is employed for the speaker recognition. The experimental results show that the proposed ESRS can significantly improve the performance of emotional speaker recognition, and the identification rate (IR) is higher than that of the traditional recognition system. The emotional speech with F0 and duration modifications is closer to the neutral one. 展开更多
关键词 emotion recognition speaker recognition F0 transformation duration modification
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部