面向6G的跨模态信号重建技术被引量：3

6G-oriented cross-modal signal reconstruction technology

下载PDF

导出

摘要 6G时代下,为了兼顾多媒体用户音频、视频、触觉的沉浸式体验需求与低时延、高可靠、大容量的通信质量,提出一种跨模态信号重建架构和由视频信号重建触觉信号的深度学习模型。首先,通过控制机器人触摸各种材质,构建了包含音频、视频、触觉信号的数据集VisTouch,为后续各种跨模态问题的研究奠定基础;其次,通过利用多模态信号间的语义关联性,设计一种普适的、稳健的端到端跨模态信号重建框架;再次,以通过视频信号重建触觉信号为例,构建视频辅助的触觉重建模型,包括基于3D CNN的视频特征提取网络,基于全卷积网络的GAN生成网络与基于CNN的GAN辨别网络;最后,通过实验结果验证跨模态信号重建框架的可靠性以及触觉重建模型的准确性。 In the 6G era,to balance the immersive experience needs of multimedia users for audio,video,and haptics with low-latency,high-reliability,and large-capacity communication,a cross-modal signal reconstruction framework and video-to-haptic reconstruction model was proposed.First,robots were controlled to touch various materials.In this way,a large-scale dataset VisTouch that includes audio,video,and haptic signals was constructed.This dataset could lay the foundation for subsequent researches on various cross-modal problems.In addition,based on the semantic relations of multi-modal signals,a universe and robust end-to-end cross-modal signal reconstruction framework was designed.Furthermore,the reconstruction from video to haptic signals was taken as an example.A video-assisted haptic reconstruction model was established,including a 3D CNN-based video extraction sub-network,a fully convolutional network based GAN generation sub-network and a CNN-based GAN discrimination sub-network.Finally,the reliability of the cross-modal signal reconstruction framework and the accuracy of the proposed video-to-haptic model were verified through experimental results.

作者李昂陈建新魏昕周亮 LI Ang;CHEN Jianxin;WEI Xin;ZHOU Liang(College of Telecommunications&Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;Key Laboratory of Broadband Wireless Communication and Sensor Network Technology(Ministry of Education),Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

机构地区南京邮电大学通信与信息工程学院南京邮电大学宽带无线通信与传感网技术教育部重点实验室

出处《通信学报》 EI CSCD 北大核心 2022年第6期28-40,共13页 Journal on Communications

基金国家自然科学基金资助项目(No.62071254) 江苏高校优势学科建设工程基金资助项目。

关键词 6G 跨模态信号重建多模态数据集 3D卷积神经网络生成对抗网络 6G cross-modal signal reconstruction multi-modal dataset 3D CNN GAN

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1高赟,魏昕,周亮.跨模态通信理论及关键技术初探[J].中国传媒大学学报（自然科学版）,2021(1):55-63. 被引量：2
2王万良,李卓蓉.生成式对抗网络研究进展[J].通信学报,2018,39(2):135-148. 被引量：65

二级参考文献2

1周昌令,栾兴龙,肖建国.基于深度学习的域名查询行为向量空间嵌入[J].通信学报,2016,37(3):165-174. 被引量：9
2王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(3):321-332. 被引量：317

共引文献65

1宁宁,金鑫,张晓昆,李艳楠.基于GAN的人脸图像光照迁移[J].北京电子科技学院学报,2019(4):33-41.
2胡宇,王舰,孙宇清.一种基于参考规范的专业文本生成方法[J].中文信息学报,2023,37(3):152-163. 被引量：1
3陈梦凡,郑豪,吴建.基于生成对抗网络的复合功能体系计算性设计——以职业技术学院校园平面生成为例[J].建筑学报,2022(S01):103-108. 被引量：5
4王庆飞,姜燕,鲍娟.基于条件生成对抗网络的手势图像背景去除方法[J].计算机应用研究,2020,37(S02):401-403. 被引量：1
5吴宏杰,戴大东,傅启明,陈建平,陆卫忠.强化学习与生成式对抗网络结合方法研究进展[J].计算机工程与应用,2019,55(10):36-44. 被引量：11
6张成彬,赵慧,曹宗钰.基于深度学习的车身网络KWP2000协议漏洞挖掘[J].山东大学学报（工学版）,2019,49(2):17-22. 被引量：6
7翁子欣,张凯,罗培铖,吴明晖.基于CycleGAN的图像风格转换方法及应用[J].计算机时代,2019,0(8):24-28. 被引量：3
8张晗,郭渊博,李涛.结合GAN与BiLSTM-Attention-CRF的领域命名实体识别[J].计算机研究与发展,2019,56(9):1851-1858. 被引量：30
9王格格,郭涛,李贵洋.多层感知器深度卷积生成对抗网络[J].计算机科学,2019,46(9):243-249. 被引量：6
10周林勇,谢晓尧,刘志杰,谭宏卫,游善平.基于ACGAN的图像识别算法[J].计算机工程,2019,45(10):246-252. 被引量：10

同被引文献14

1权伟,张宏科.未来互联网体系的研究现状、热点与探索实践[J].中国科学：信息科学,2017,47(6):804-810. 被引量：11
2邬江兴.新型网络技术发展思考[J].中国科学：信息科学,2018,48(8):1102-1111. 被引量：26
3张平,牛凯,田辉,聂高峰,秦晓琦,戚琦,张娇.6G移动通信技术展望[J].通信学报,2019,40(1):141-148. 被引量：140
4王磊,林煌达,康彬,崔景伍,郑宝玉.时延约束下采用SVC编码的D2D协作视频多播传输方案[J].信号处理,2019,35(3):369-377. 被引量：3
5常天庆,赵立阳,郭理彬,张雷,郝娜.坦克战场环境多目标威胁评估方法研究[J].兵器装备工程学报,2019,40(5):88-93. 被引量：15
6郑宝玉,李昂.基于快速稀疏低秩和鲁棒主成分分析的图像处理算法的研究[J].信号处理,2020,36(2):290-296. 被引量：7
7田思波,樊晓旭.自动驾驶测试场景标准体系建设的研究和思考[J].中国标准化,2020(4):87-91. 被引量：5
8吕品,许嘉,李陶深,徐文彪.面向自动驾驶的边缘计算技术研究综述[J].通信学报,2021,42(3):190-208. 被引量：18
9牛凯,戴金晟,张平,姚圣时,王思贤.面向6G的语义通信[J].移动通信,2021,45(4):85-90. 被引量：26
10刘传宏,郭彩丽,杨洋,陈九九,朱美逸,孙鲁楠.面向智能任务的语义通信:理论、技术和挑战[J].通信学报,2022,43(6):41-57. 被引量：10

引证文献3

1房颖,徐艺文,赵铁松.面向机器识别-人类感知的联合振动触觉编码[J].通信学报,2023,44(5):42-51.
2陈鸣锴,柳明浩,王文俊,王磊,郑宝玉.面向6G的跨模态语义编解码技术[J].信号处理,2023,39(7):1141-1154.
3陈亚男,李昂,吴丹.基于六维语义空间的自动驾驶风险评估研究[J].通信学报,2024,45(1):77-93.

1戴含芳,王衍学,李志星.基于元素分析的滚动轴承故障诊断[J].电子测量与仪器学报,2022,36(1):157-165.
2吕冠男,刘海鹏,王蒙,卢建宏.基于稀疏度自适应的压缩感知重构算法研究[J].陕西理工大学学报（自然科学版）,2022,38(3):15-21.
3周丹.求异思维在新闻采编工作中的应用分析[J].卫星电视与宽带多媒体,2022(10):157-158. 被引量：2
4王慧,隋新玉.基于文旅深度融合的辽宁传统村落旅游优质发展路径探析[J].农业经济,2022(5):137-139. 被引量：11
5杨勇,宁平华,王晟,华旭刚,温青.基于解析模式分解和随机减量技术的桥梁模态参数识别[J].铁道科学与工程学报,2022,19(5):1355-1363. 被引量：7
6黄伟兵,陆建常,李高忠,谭莉平.迭代重建技术联合双低剂量扫描在冠状动脉CT血管成像中的应用价值[J].影像研究与医学应用,2022,6(11):104-106. 被引量：3
7李书林,冯朝路,于鲲,刘鑫,江鑫,赵大哲.基于深度学习的心脏磁共振影像超分辨率前沿进展[J].中国图象图形学报,2022,27(3):704-721. 被引量：2
8人物[J].服务外包,2022(6):10-11.
9马栋,席建武,周特丽.128层螺旋CT多平面重组技术在肺孤立性结节形态特征筛查中的应用价值[J].甘肃科技,2022,38(5):104-106. 被引量：2

通信学报

2022年第6期

浏览历史

内容加载中请稍等...

面向6G的跨模态信号重建技术被引量：3

参考文献2

二级参考文献2

共引文献65

同被引文献14

引证文献3

相关作者

相关机构

相关主题

浏览历史

面向6G的跨模态信号重建技术 被引量：3

参考文献2

二级参考文献2

共引文献65

同被引文献14

引证文献3

相关作者

相关机构

相关主题

浏览历史

面向6G的跨模态信号重建技术被引量：3