题名 一种新颖的基频包络聚类方法
被引量:1
1
作者
黄平牧
刘刚
郭军
机构
北京邮电大学信息工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第8期1362-1370,共9页
基金
国家自然科学基金项目(60705019)~~
文摘
主要研究音节基频包络的聚类问题.在聚类的基础上,通过合理的样本选择,可以实现对大语料库的裁减,再结合现有的语音编码技术,就能够构建出一个小存储容量多样本的带调音节语音库,来满足嵌入式TTS系统对合成语音清晰度和自然度的要求.针对音节基频包络长度的不同,给出了一种非定长包络的聚类方法,这种方法将DP(dynamic programming)的概念融入了聚类.首先利用DP的思想,在两个基频包络之间寻找一条最佳路径,然后再沿这一路径进行两包络的相似度计算,若两包络形状类似,距离测度的值会很小.实验表明,与传统的方法相比,使用新方法可以获得更好的聚类结果.合成实验也验证了这种方法的有效性.
关键词
音库裁减
基频包络
DP
K均值聚类
DB
Index系数
Keywords
speech corpus reduction
pitch contour
DP
K-mean clustering
DBindex
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于情感语音的差异检测与剔除的说话人识别
2
作者
黄挺
杨莹春
机构
浙江大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第21期33-36,共4页
基金
国家高技术研究发展计划( 863)(the National High- Tech Research and Development Plan of China under Grant No.2006AA01Z136)
浙江省自然科学基金(the Natural Science Foundation of Zhejiang Province of China under Grant No.Y106705)
文摘
提出了一种基于情感语音的差异检测与剔除的说话人识别方法,克服了前人的方法中需要在训练时提供测试说话人的情感语音或者需要在测试时提供测试语音的情感状态信息给系统的使用带来的不便性,并在识别性能上比传统的ASR系统提高4.7%。
关键词
情感语音
差异检测
基频包络
说话人识别
Keywords
emotion speech
difference detection
pitch envelope
speaker recognition
分类号
TP391
[自动化与计算机技术—计算机应用技术]