期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于多模态感知的双声道音频生成方法
被引量:
1
1
作者
官丽
尹康
+2 位作者
樊梦佳
薛昆
解凯
《计算技术与自动化》
2022年第4期157-165,共9页
现有多数视频只包含单声道音频,缺乏双声道音频所带来的立体感。针对这一问题,本文提出了一种基于多模态感知的双声道音频生成方法,其在分析视频中视觉信息的基础上,将视频的空间信息与音频内容融合,自动为原始单声道音频添加空间化特征...
现有多数视频只包含单声道音频,缺乏双声道音频所带来的立体感。针对这一问题,本文提出了一种基于多模态感知的双声道音频生成方法,其在分析视频中视觉信息的基础上,将视频的空间信息与音频内容融合,自动为原始单声道音频添加空间化特征,生成更接近真实听觉体验的双声道音频。我们首先采用一种改进的音频视频融合分析网络,以编码器-解码器的结构,对单声道视频进行编码,接着对视频特征和音频特征进行多尺度融合,并对视频及音频信息进行协同分析,使得双声道音频拥有了原始单声道音频所没有的空间信息,最终生成得到视频对应的双声道音频。在公开数据集上的实验结果表明,本方法取得了优于现有模型的双声道音频生成效果,在STFT距离以及ENV距离两项指标上均取得提升。
展开更多
关键词
音频生成
卷积神经网络
多模态
下载PDF
职称材料
基于还音转换规则的胶片音频生成方法
被引量:
2
2
作者
王睿琦
程皓楠
+1 位作者
叶龙
齐秋棠
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2022年第10期1524-1532,共9页
还音作为一种将电影音轨胶片记录的声波信号图转换为音频的过程,是老电影重映中的重要环节.为解决当前还音方法中音频生成失真的问题,提出了一种基于还音转换规则的胶片音频生成方法,可实现音轨胶片图像到音频信号的高精度自动化生成....
还音作为一种将电影音轨胶片记录的声波信号图转换为音频的过程,是老电影重映中的重要环节.为解决当前还音方法中音频生成失真的问题,提出了一种基于还音转换规则的胶片音频生成方法,可实现音轨胶片图像到音频信号的高精度自动化生成.该方法包含2部分:一是在基于光电转换规则的包络线修正中,基于光度积分的包络线提取,并基于光学规则进行局部与全局校正,解决了光电转换过程中的信号误差问题;二是在基于频率调制规则的音频生成中,设计直流偏量调节方法,并基于电影音频录制还音标准进行信号频域调制,提升了合成音频质量.通过对MovieAD数据集中6类不同类别胶片进行音频生成并测试主观及客观音频评价,结果显示,相比目前较新的还音方法,文中方法生成的音频质量平均提高8.00%以上,且音频采样率可提高到行业标准的162.08%.
展开更多
关键词
音轨胶片
图像处理
跨模态
音频生成
下载PDF
职称材料
基于生成对抗网络与特征融合的多尺度音频序列生成方法
3
作者
许华杰
张勃
《计算机应用研究》
CSCD
北大核心
2023年第9期2770-2774,共5页
音频数据规模不足是语音识别过程中的一个常见问题,通过较少的训练数据训练得到的语音识别模型效果难以得到保证。因此,提出一种基于生成对抗网络与特征融合的多尺度音频序列生成方法(multi-scale audio sequence GAN,MAS-GAN),包含多...
音频数据规模不足是语音识别过程中的一个常见问题,通过较少的训练数据训练得到的语音识别模型效果难以得到保证。因此,提出一种基于生成对抗网络与特征融合的多尺度音频序列生成方法(multi-scale audio sequence GAN,MAS-GAN),包含多尺度音频序列生成器和真伪—类别判别器。生成器通过3个上采样子网络学习音频序列不同时域和频域的特征,再将不同尺度的特征融合成伪音频序列;判别器通过辅助分类器将生成的伪数据和真实数据区分开,同时指导生成器生成各类别的数据。实验表明,与目前主流的音频序列生成方法相比,所提方法的IS和FID分数分别提高了6.78%和3.75%,可以生成更高质量的音频序列;同时通过在SC09数据集上进行分类实验来评估生成音频序列的质量,所提方法的分类准确率比其他方法高2.3%。
展开更多
关键词
音频
序列
生成
生成
对抗网络
半监督学习
特征融合
下载PDF
职称材料
题名
一种基于多模态感知的双声道音频生成方法
被引量:
1
1
作者
官丽
尹康
樊梦佳
薛昆
解凯
机构
国网北京市电力公司
南京南瑞继保电气有限公司
出处
《计算技术与自动化》
2022年第4期157-165,共9页
文摘
现有多数视频只包含单声道音频,缺乏双声道音频所带来的立体感。针对这一问题,本文提出了一种基于多模态感知的双声道音频生成方法,其在分析视频中视觉信息的基础上,将视频的空间信息与音频内容融合,自动为原始单声道音频添加空间化特征,生成更接近真实听觉体验的双声道音频。我们首先采用一种改进的音频视频融合分析网络,以编码器-解码器的结构,对单声道视频进行编码,接着对视频特征和音频特征进行多尺度融合,并对视频及音频信息进行协同分析,使得双声道音频拥有了原始单声道音频所没有的空间信息,最终生成得到视频对应的双声道音频。在公开数据集上的实验结果表明,本方法取得了优于现有模型的双声道音频生成效果,在STFT距离以及ENV距离两项指标上均取得提升。
关键词
音频生成
卷积神经网络
多模态
Keywords
audio generation
CNN
multimodal
分类号
TP393.03 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于还音转换规则的胶片音频生成方法
被引量:
2
2
作者
王睿琦
程皓楠
叶龙
齐秋棠
机构
中国传媒大学媒介音视频教育部重点实验室
中国传媒大学媒体融合与传播国家重点实验室
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2022年第10期1524-1532,共9页
基金
国家自然科学基金面上项目(2021YFF0900504)
国家自然科学基金重点项目(61631016).
文摘
还音作为一种将电影音轨胶片记录的声波信号图转换为音频的过程,是老电影重映中的重要环节.为解决当前还音方法中音频生成失真的问题,提出了一种基于还音转换规则的胶片音频生成方法,可实现音轨胶片图像到音频信号的高精度自动化生成.该方法包含2部分:一是在基于光电转换规则的包络线修正中,基于光度积分的包络线提取,并基于光学规则进行局部与全局校正,解决了光电转换过程中的信号误差问题;二是在基于频率调制规则的音频生成中,设计直流偏量调节方法,并基于电影音频录制还音标准进行信号频域调制,提升了合成音频质量.通过对MovieAD数据集中6类不同类别胶片进行音频生成并测试主观及客观音频评价,结果显示,相比目前较新的还音方法,文中方法生成的音频质量平均提高8.00%以上,且音频采样率可提高到行业标准的162.08%.
关键词
音轨胶片
图像处理
跨模态
音频生成
Keywords
film soundtrack
image processing
sound generation
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于生成对抗网络与特征融合的多尺度音频序列生成方法
3
作者
许华杰
张勃
机构
广西大学计算机与电子信息学院
广西大学广西多媒体通信与网络技术重点实验室
广西大学广西高校并行分布与智能计算重点实验室
广西大学广西智能数字服务工程技术研究中心
出处
《计算机应用研究》
CSCD
北大核心
2023年第9期2770-2774,共5页
基金
国家自然科学基金资助项目(71963001)
广西壮族自治区科技计划资助项目(2017AB15008)
崇左市科技计划资助项目(FB2018001)。
文摘
音频数据规模不足是语音识别过程中的一个常见问题,通过较少的训练数据训练得到的语音识别模型效果难以得到保证。因此,提出一种基于生成对抗网络与特征融合的多尺度音频序列生成方法(multi-scale audio sequence GAN,MAS-GAN),包含多尺度音频序列生成器和真伪—类别判别器。生成器通过3个上采样子网络学习音频序列不同时域和频域的特征,再将不同尺度的特征融合成伪音频序列;判别器通过辅助分类器将生成的伪数据和真实数据区分开,同时指导生成器生成各类别的数据。实验表明,与目前主流的音频序列生成方法相比,所提方法的IS和FID分数分别提高了6.78%和3.75%,可以生成更高质量的音频序列;同时通过在SC09数据集上进行分类实验来评估生成音频序列的质量,所提方法的分类准确率比其他方法高2.3%。
关键词
音频
序列
生成
生成
对抗网络
半监督学习
特征融合
Keywords
audio sequence generation
generative adversarial network
semi-supervised learning
feature fusion
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于多模态感知的双声道音频生成方法
官丽
尹康
樊梦佳
薛昆
解凯
《计算技术与自动化》
2022
1
下载PDF
职称材料
2
基于还音转换规则的胶片音频生成方法
王睿琦
程皓楠
叶龙
齐秋棠
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2022
2
下载PDF
职称材料
3
基于生成对抗网络与特征融合的多尺度音频序列生成方法
许华杰
张勃
《计算机应用研究》
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部