期刊文献+

DirectShow技术在音频格式转换及音视频分离方面的应用 被引量:3

下载PDF
导出
摘要 目前语音识别系统的输入都是线性PCM格式的音频文件,然而在实际应用中,需要识别各种格式音频文件以及视频流中的音频,在开始识别前,需要进行音频格式转换并从视频流中进行音频提取。因此,音频格式的转换和从视频中分离出音频信号已成为语音识别系统一种必需的预处理过程。文中介绍了一种将M icrosoft的D irectShow技术应用于W indows平台的多种压缩音频格式转换为W indows PCM WAV格式以及从多媒体视频中分离音频信号的方法,并分析了常见音频压缩编码格式经转换后对语音识别系统性能的影响。这对于语音识别技术在实际中的应用有着重要的意义。
作者 徐燃 潘接林
出处 《计算机应用》 CSCD 北大核心 2005年第B12期387-390,共4页 journal of Computer Applications
  • 相关文献

参考文献3

  • 1Microsoft Corporation. DirectX 9.0 Programmer's Reference[ CP/DK], 2002.
  • 2.布拉格/(天极数码).常见音频格式面面观之技术篇[EB/OL].http://www. cseek. com/technology/289922524546859008/20040317/1778235.shtml,2004—03—17.
  • 3凌云风.聚焦热点:流行音频格式大比拼[EB/OL].http://ww.pconline.com.cn/pcedu/soft/gj/medid03 10/232688.html,2004—2—13.

同被引文献19

引证文献3

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部