期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于跨模态的无监督影视剧说话人识别
1
作者 冯骋 库天锡 +3 位作者 杨卫星 李雪蒙 谭小琼 梁超 《计算机应用与软件》 CSCD 2016年第5期132-135,147,共5页
现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用依赖于训练样本质量的有监督学习,而现实中一般难以获得充足的训练样本。针对影视剧中的角色识别,提出一... 现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用依赖于训练样本质量的有监督学习,而现实中一般难以获得充足的训练样本。针对影视剧中的角色识别,提出一种跨模态的无监督说话人识别方法:首先基于声学特征和时间近邻性的音频聚类获得对应聚类结果的音频标记序列;然后通过剧本解析获得对应说话人、说话内容、说话时间的文本标记序列;接着将音频序列与文本序列进行跨模态序列匹配,构造满射解出最小编辑距离,从而实现说话人识别。实验结果表明,在训练集较少的情况下该方法比有监督方法具有更高识别率。 展开更多
关键词 说话人识别 说话人聚类 编辑距离 混合高斯模型 序列匹配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部