期刊文献+

基于视觉画面的空间音频合成及电影行业应用研究 被引量:4

Research on spatial audio synthesis and its application on film industry based on visual contents
下载PDF
导出
摘要 新时代电影强国建设对电影技术的发展提出了新要求,创新视听算法和更优模型的自主研发成为人们关注的重点。部分早期影片存储时仅包含单声道音频,不能提供良好的听觉体验。为了解决这个问题,本文提出了一种利用视觉画面和已有单声道音频合成空间音频的方法,重构音频中的空间信息。该方法首先对单声道视频进行声源分离和定位,将其拆解成多个单声源及其位置信息。之后再对其进行空间音频重构,得到与视觉位置信息相一致的更加逼真的音频。实验结果表明,本文方法可以得到与视觉位置信息相一致的更加逼真的空间音频,给用户带来更好的沉浸体验。 The construction of a vibrant and energetic film country in the new era has put forward new requirements for the development of film technology.People pay more attention on innovating audiovisual algorithms and independent research and development of better models.Some early films were stored with only mono audio,which fail to provide an immersive auditory experience.To this end,this paper proposes a novel method of synthesising spatial audio,which reconstructs spatial information in the audio by leveraging visual contents and the given mono audio.This method first performs sound source separation and localisation on mono video and disassembles the mono video into multiple mono sources and their corresponding location information.Then,spatial audio reconstruction is performed to obtain more immersive audio consistent with visual contents.The experimental results showed that the proposed method can produce more realistic spatial audio synchronised with visual information,providing users with a more immersive experience.
作者 李思佳 刘世光 Li Sijia;Liu Shiguang(College of Intelligence and Computing,Tianjin University)
出处 《现代电影技术》 2023年第9期4-10,45,共8页 Advanced Motion Picture Technology
基金 国家自然科学基金项目《水下声音传播的真实感模拟关键技术研究》(62072328)。
关键词 视觉信息 空间音频 声源分离 深度学习 音频空间化 Visual Information Spatial Audio Sound Source Separation Deep Learning Audio Spatialisation
  • 相关文献

同被引文献51

引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部