期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于视觉画面的空间音频合成及电影行业应用研究被引量：4

Research on spatial audio synthesis and its application on film industry based on visual contents

下载PDF

导出

摘要新时代电影强国建设对电影技术的发展提出了新要求,创新视听算法和更优模型的自主研发成为人们关注的重点。部分早期影片存储时仅包含单声道音频,不能提供良好的听觉体验。为了解决这个问题,本文提出了一种利用视觉画面和已有单声道音频合成空间音频的方法,重构音频中的空间信息。该方法首先对单声道视频进行声源分离和定位,将其拆解成多个单声源及其位置信息。之后再对其进行空间音频重构,得到与视觉位置信息相一致的更加逼真的音频。实验结果表明,本文方法可以得到与视觉位置信息相一致的更加逼真的空间音频,给用户带来更好的沉浸体验。 The construction of a vibrant and energetic film country in the new era has put forward new requirements for the development of film technology.People pay more attention on innovating audiovisual algorithms and independent research and development of better models.Some early films were stored with only mono audio,which fail to provide an immersive auditory experience.To this end,this paper proposes a novel method of synthesising spatial audio,which reconstructs spatial information in the audio by leveraging visual contents and the given mono audio.This method first performs sound source separation and localisation on mono video and disassembles the mono video into multiple mono sources and their corresponding location information.Then,spatial audio reconstruction is performed to obtain more immersive audio consistent with visual contents.The experimental results showed that the proposed method can produce more realistic spatial audio synchronised with visual information,providing users with a more immersive experience.

作者李思佳刘世光 Li Sijia;Liu Shiguang(College of Intelligence and Computing,Tianjin University)

机构地区天津大学智能与计算学部

出处《现代电影技术》 2023年第9期4-10,45,共8页 Advanced Motion Picture Technology

基金国家自然科学基金项目《水下声音传播的真实感模拟关键技术研究》(62072328)。

关键词视觉信息空间音频声源分离深度学习音频空间化 Visual Information Spatial Audio Sound Source Separation Deep Learning Audio Spatialisation

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献51

1祁勇,刘传.“智能+”电影产业:人工智能介入电影产业问题前瞻[J].文艺争鸣,2022(9):200-204. 被引量：7
2尤西林.以文学批评为枢纽的文学理论建构[J].文艺理论研究,2015(3):69-74. 被引量：21
3石小溪.走向工业化的中国电影——专访万达文化集团副总裁、《寻龙诀》出品人叶宁[J].当代电影,2016(2):10-14. 被引量：6
4张卫,尹鸿,安晓芬,周铁东,田艳茹(整理),李俊可(整理).中国电影产业格局中的技术美学[J].当代电影,2016(11):12-19. 被引量：5
5刘正山.中国电影工业化的现状与路径[J].中国电影市场,2017,0(7):32-35. 被引量：9
6陈旭光,张立娜.电影工业美学原则与创作实现[J].电影艺术,2018(1):99-105. 被引量：114
7饶曙光,李国聪.“重工业电影”及其美学:理论与实践[J].当代电影,2018(4):102-108. 被引量：44
8肖和俭.试论放映中主声道故障的应急处理及维修[J].中国传媒科技,2018,0(6):82-83. 被引量：1
9张卫.新时代中国电影工业升级的细密分工与整体布局[J].浙江传媒学院学报,2018,0(1):30-34. 被引量：15
10郭帆,周黎明,孟琪.“拍摄共情的中国工业电影”——郭帆导演访谈[J].当代电影,2019,0(5):27-32. 被引量：22

引证文献4

1朱宇平.空间音频技术在广播电视领域的应用研究[J].电声技术,2023,47(6):115-117.
2丁雄.音频处理软件在电影制作中的应用[J].电声技术,2023,47(12):108-110.
3陈旭光,张明浩.“技”能不能上升为“道”:电影工业美学技术美学之维“接着讲”[J].现代电影技术,2024(3):26-32.
4常慧琴,曾真.人工智能大模型在电影行业的发展展望与应用思考[J].电影评介,2024(13):8-14.

1韩俊.声瑜伽揭秘[J].健与美,2023(9):76-78.
2本期导读[J].现代电影技术,2023(9):3-3.
3许烨.数字技术赋能高校思想政治教育:价值、困境和路径[J].湖南社会科学,2023(4):156-163. 被引量：16
4梁雄.HT3163宽电压3V-18V供电、AB/D类切换40W单声道音频功放IC应用方案[J].世界电子元器件,2023(7):49-52.
5刘成盼,刘济超,刘东亮.认知视域下有孔虫命名中的意象隐喻[J].中国科技术语,2023,25(4):88-95.
6庞守贵,聂芸芸,李刚存.空间美学与沉浸体验:滇越铁路红河州段VR全景数字化呈现与传播研究[J].红河学院学报,2023,21(5):28-31.
7毕伟,梁悦,吴琼.交互与沉浸:岭南红色文化特色小镇的多频道网络叙事研究[J].出版科学,2023,31(5):51-62. 被引量：2
8苏畅,高卓.影视剧音乐的情感与使用因素——以《红楼梦》为例[J].艺术研究（哈尔滨师范大学艺术学报）,2023(4):105-107.
9张宇航,李军锋.基于时频掩蔽的球形阵声源定位系统[J].网络新媒体技术,2023,12(3):43-50.
10廖丹薇,刘翊贤,张志旺,程营,刘晓峻,Johan Christensen.基于合成维度空间中深亚波长拓扑角态的声彩虹捕获[J].Science Bulletin,2023,68(16):1744-1747. 被引量：3

现代电影技术

2023年第9期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部