-
题名广播语音的音频分割
被引量:11
- 1
-
-
作者
贾磊
穆向禺
徐波
-
机构
中国科学院自动化所
-
出处
《中文信息学报》
CSCD
北大核心
2002年第1期37-42,共6页
-
基金
国家自然科学基金重点项目 (6 9835 0 0 3)
国家"973"项目 (G19980 30 5 0 4 )
-
文摘
本文的广播电视新闻的分割系统分为三部分 :分割、分类和聚类。分割部分是采用本文提出的基于检测熵变化趋势的分割算法来检测连续语音音频信号的声学特征跳变点 ,从而实现不同性质的音频信号的分割。这种检测方法不同于传统的需要门限的跳变点检测方法 ,它是以检测一定窗长的信号内部的每一个可能的分割点所分割的两段信号的信号熵的变化趋势来检测音频信号声学特征跳变点的 ,可以避免由于门限的选择不当所带来的分割错误。分类部分是采用传统的基于高斯混合模型 (GMM )的高斯分类器进行分类 ,聚类部分采用基于矢量量化 (VQ)的说话人聚类算法进行说话人聚类。应用此系统分割三段 30分钟的新闻 ,成功的实现了连续音频信号的分割 ,去除掉了所有的背景音乐 ,以较高的精度把属于同一个人的说话语音划归为一类 。
-
关键词
广播语音
音频分割
声学特征跳变点检测
BIC准则
熵变化趋势
语音处理
-
Keywords
broadcasting segmentation
speaker change detection
BIC criterion
Entropy change trend
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于GLR距离和BIC的混合音频分割算法
被引量:3
- 2
-
-
作者
郑继明
俞佳
-
机构
重庆邮电大学应用数学研究所
重庆邮电大学计算机科学与技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第13期3120-3123,共4页
-
基金
重庆市教育委员会科学技术研究基金项目(KJ080524)
-
文摘
针对传统单一音频分割算法中存在的冗余分割点过多问题,研究了一种基于一般似然比(GLR)和贝叶斯信息准则(BIC)相结合的广播音频顺序分割算法,提出了候选跳变点潜在区域的判断准则,并给出跳变点在潜在区域的检测方法,最后对检测到的跳变点进行校验。实验结果表明,与传统的音频分割算法相比,该算法的综合性能大大提高,达到较好的分割效果。
-
关键词
广播音频分割
一般似然比
贝叶斯信息准则
声学特征跳变点
校验
-
Keywords
broadcasting segmentation
generalized likelihood ratio (GLR)
Bayesian information criterion (BIC)
acoustic change points
validation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-