-
题名基于声学分段模型的无监督语音样例检测
被引量:2
- 1
-
-
作者
李勃昊
张连海
郑永军
-
机构
解放军信息工程大学信息系统工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2016年第2期407-414,共8页
-
基金
国家自然科学基金(61175017)资助项目
-
文摘
提出一种基于声学分段模型的无监督语音样例检测方法。该方法首先利用高斯混合模型(Gaussian mixture model,GMM)将训练数据频谱参数转换为后验概率特征向量,采用层次聚类算法确定后验概率的边界信息,得到声学分段;然后通过k-means算法将片段聚类并添加标签,构建基于后验概率的声学分段模型。检索时以模型对查询样例与检索文档的解码序列代替测量矩阵以降低检索时间,通过基于最小编辑距离的动态匹配检索查询项,最小编辑距离的代价函数由模型相似度距离矩阵修正。实验结果表明,相比GMM及传统声学分段模型,本文提出的方法性能更好,检索速度得到显著提升。
-
关键词
声学分段模型
语音样例检测
后验概率特征
无监督
-
Keywords
acoustic segment models
query-by-example spoken term detection
posterior features
unsu-pervised
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于后验概率特征的改进无监督语音样例检测
- 2
-
-
作者
李勃昊
张连海
董桂芬
郑永军
-
机构
信息工程大学
海军指挥学院
-
出处
《信息工程大学学报》
2015年第4期449-453,共5页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
针对现有无监督语音样例检测精度不高的现状,提出一种基于后验概率特征和主成分分析的方法。该方法首先利用无标注语料训练GMM,得到训练数据频谱参数的高斯混元后验概率特征向量序列;采用层次聚类算法检测其边界信息得到声学分段,利用K-means算法对所有声学分段聚类并添加标签,通过声学分段和标签训练基于后验概率的声学分段模型(ASMs);ASMs将查询项与检索文档的高斯混元后验概率转换为新的后验概率,利用主成分分析方法对其优化处理,保持概率向量维数不变,去除噪声信息,提高后验概率特征向量鲁棒性与区分性;最后通过分段动态时间规整算法检索查询项。实验证明该方法的检索精度较现有方法有显著提升。
-
关键词
无监督
语音样例检测
后验概率
声学分段模型
主成分分析
-
Keywords
unsupervised
query-by-example spoken term detection
posterior features
acoustic segment models
principal components analysis
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名采用HDPHMM符号化器的语音查询样例检测方法
被引量:1
- 3
-
-
作者
曹建凯
张连海
-
机构
解放军信息工程大学信息系统工程学院
-
出处
《信号处理》
CSCD
北大核心
2017年第5期703-710,共8页
-
基金
国家自然科学基金资助项目(61673395
61403415
61302107)
-
文摘
提出一种基于层级狄利克雷过程隐马尔科夫模型(HDPHMM)符号化器的无监督语音查询样例检测(Qb E-STD)方法。该方法首先应用一个双状态层隐马尔科夫模型,其中顶层状态用于表示所发现的声学单元,底层状态用于建模顶层状态的发射概率,通过对顶层状态假设一个层级狄利克雷过程先验,获得非参贝叶斯模型HDPHMM。使用无标注语音数据对该模型进行训练,然后对测试语音和查询样例输出后验概率特征矢量,使用非负矩阵分解算法对后验概率进行优化得到新的特征,然后在此基础上,应用修正分段动态时间规整算法进行检索,构成Qb E-STD系统。实验结果表明,相比于基于高斯混合模型符号化器的基线系统,本文所提出的方法性能更优,检索精度得到显著提升。
-
关键词
无监督
语音查询样例检测
层级狄利克雷过程
非负矩阵分解
-
Keywords
unsupervised
query-by-example spoken term detection
hierarchical Dirichlet processing
non-negative ma- trix factorization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-