期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Stable-Diffusion的AI绘画方法
1
作者
冉昕哲
高琛
+3 位作者
黄小明
梁嘉桐
倪芊睿
程思琪
《计算机科学与应用》
2024年第5期147-155,共9页
本研究旨在开发一种基于AI技术的音频可视化方法,该方法能够将音频信号转化为符合歌曲主题的图片集以及视频。在此过程中,首先提取了音频中的平均频率、平均LUFS、平均相位等参数,并使用自然语言描述进行区间划分。随后利用GPT模型将音...
本研究旨在开发一种基于AI技术的音频可视化方法,该方法能够将音频信号转化为符合歌曲主题的图片集以及视频。在此过程中,首先提取了音频中的平均频率、平均LUFS、平均相位等参数,并使用自然语言描述进行区间划分。随后利用GPT模型将音频数据描述转化为文字形式,为稳定扩散算法提供实例化的提示。在技术方案中,我们引入了基于Stable-Diffusion的AI绘画方法,通过对音频信息的处理与关键字生成,最终生成了高质量且逼真的音频可视化艺术作品。此外,我们还成功地将生成的艺术作品转化为相应的视频作品。整个流程具有较高的自由度和创造力,可为音乐和艺术创作领域带来新的可能性。
展开更多
关键词
AI技术
音频可视化
稳定扩散算法
GPT模型
下载PDF
职称材料
题名
基于Stable-Diffusion的AI绘画方法
1
作者
冉昕哲
高琛
黄小明
梁嘉桐
倪芊睿
程思琪
机构
北京信息科技大学计算机学院
出处
《计算机科学与应用》
2024年第5期147-155,共9页
文摘
本研究旨在开发一种基于AI技术的音频可视化方法,该方法能够将音频信号转化为符合歌曲主题的图片集以及视频。在此过程中,首先提取了音频中的平均频率、平均LUFS、平均相位等参数,并使用自然语言描述进行区间划分。随后利用GPT模型将音频数据描述转化为文字形式,为稳定扩散算法提供实例化的提示。在技术方案中,我们引入了基于Stable-Diffusion的AI绘画方法,通过对音频信息的处理与关键字生成,最终生成了高质量且逼真的音频可视化艺术作品。此外,我们还成功地将生成的艺术作品转化为相应的视频作品。整个流程具有较高的自由度和创造力,可为音乐和艺术创作领域带来新的可能性。
关键词
AI技术
音频可视化
稳定扩散算法
GPT模型
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Stable-Diffusion的AI绘画方法
冉昕哲
高琛
黄小明
梁嘉桐
倪芊睿
程思琪
《计算机科学与应用》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部