-
题名基于神经网络的图像风格迁移研究进展
被引量:1
- 1
-
-
作者
廉露
田启川
谭润
张晓行
-
机构
北京建筑大学电气与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第9期30-47,共18页
-
基金
北京建筑大学研究生教育教学质量提升项目(J2022012)
北京建筑大学教育教学研究项目(Y2130)
北京建筑大学混合式课程建设项目(YC23019)。
-
文摘
图像风格迁移是用风格图像对指定图像的内容进行重映射的过程,是人工智能计算机视觉领域中的一个研究热点。传统的图像风格迁移方法主要基于物理、纹理技术的合成,风格迁移效果较为粗糙并且鲁棒性较差,随着图像数据集的出现和各种深度学习模型网络的提出,涌现了许多图像风格迁移的模型和算法。通过对图像风格迁移研究现状的分析,梳理了图像风格迁移的发展脉络和最新的研究进展,并通过对比分析给出了图像风格迁移未来的研究方向。
-
关键词
图像风格迁移
深度学习
卷积神经网络
注意力机制
-
Keywords
image style transfer
deep learning
convolutional neural network
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名人脸关键点检测研究综述
被引量:1
- 2
-
-
作者
张晓行
田启川
廉露
谭润
-
机构
北京建筑大学电气与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第12期48-60,共13页
-
基金
北京建筑大学研究生教育教学质量提升项目(J2022012)
北京建筑大学教育教学研究项目(Y2130)
北京建筑大学混合式课程建设项目(YC23019)。
-
文摘
随着计算机视觉等技术的快速发展,人机交互、医疗辅助、安防监控等领域迅速崛起,人脸关键点检测作为其中一项重要任务备受关注,它可以在图像或视频中定位和检测人脸关键点,具有很高的实用价值。通过对人脸关键点检测方法研究现状的梳理和分析,将其分为传统的人脸关键点检测方法和基于深度学习的人脸关键点检测方法;对比分析了各类方法的原理及优缺点,介绍常用数据集和评价指标,全面评估了重点方法在不同数据集上的性能表现;归纳人脸关键点检测应用领域,展望其未来发展方向。
-
关键词
人脸关键点检测
深度学习
传统人脸关键点检测
-
Keywords
facial landmark detection
deep learning
traditional facial landmark detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于U-Net变体的医学图像分割算法综述
- 3
-
-
作者
崔珂
田启川
廉露
-
机构
北京建筑大学电气与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第11期32-49,共18页
-
基金
北京建筑大学研究生教育教学质量提升项目(J2022012)
北京建筑大学教育教学研究项目(Y2130)
北京建筑大学混合式课程建设项目(YC23019)。
-
文摘
U-Net简单高效的网络结构,被广泛应用于医学图像分割任务中,学者们针对U-Net结构进行了很多的研究和改进。基于U-Net网络结构的改进方法从以下方面进行归纳总结:总结了U-Net网络在医学图像分割领域的关键挑战;归纳了常用于U-Net网络的医学图像数据集格式及特点;重点总结U-Net和U-Net变体算法六大改进机制:跳跃连接机制、生成对抗网络、残差连接机制、3D-UNet、Transformer机制、密集连接机制。最后,探讨六大改进机制与常用医学数据之间的关系,并指出未来改进思路和方向,激发U-Net在医学图像分割的无限潜力。
-
关键词
U-Net变体
医学图像分割
语义分割
深度学习
改进机制
-
Keywords
U-Net variants
medical image segmentation
semantic segmentation
deep learning
improved mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合超分辨率重构的图像任意风格迁移
- 4
-
-
作者
谭润
田启川
廉露
张晓行
-
机构
北京建筑大学电气与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第15期170-179,共10页
-
基金
北京建筑大学研究生教育教学质量提升项目(J2022012)
北京建筑大学研究生创新项目。
-
文摘
图像风格迁移是指将一张普通照片转化为具有其他艺术风格效果的图像。针对风格迁移算法中无法重构生成图像的分辨率而造成生成图像清晰度低、纹理细节表现不丰富的问题,提出一种融合超分辨率重构的图像任意风格迁移模型。模型中加入的多支路特征处理模块通过计算特征的自相似性以增强特征的表达,提出新的特征融合模块以提升特征融合效果,提出特征解码模块来实现图像的超分辨率重构,并在其中多次进行特征融合以提升风格化图像的质量;在损失函数中加入生成对抗损失和白化处理来进一步提升风格化效果。实验表明,模型具有较好的任意风格迁移效果,分辨率重构后的风格化图像的细节丰富、纹理清晰。
-
关键词
任意风格迁移
超分辨率重构
生成对抗网络
自注意力机制
-
Keywords
arbitrary style transfer
super-resolution reconstruction
generative adversarial network
self-attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习的图像修复方法研究进展
- 5
-
-
作者
陈文祥
田启川
廉露
张晓行
王浩吉
-
机构
北京建筑大学电气与信息工程学院
-
出处
《计算机工程与应用》
2024年第22期58-73,共16页
-
基金
北京建筑大学研究生教育教学质量提升项目(J2022012)
北京建筑大学教育教学研究项目(Y2130)
北京建筑大学混合式课程建设项目(YC23019)。
-
文摘
图像修复是通过算法或技术对受损或缺失的图像进行恢复和修复的过程,是计算机视觉领域的研究热点之一。梳理了近些年基于深度学习的图像修复方法的发展脉络,将其分为单模态图像修复方法和多模态图像修复方法。单模态图像修复方法分为基于卷积自编码的图像修复方法、基于GAN的图像修复方法、基于Transformer的图像修复方法和基于扩散模型的图像修复方法,而多模态图像修复方法分为基于文本引导的图像修复方法、基于音频引导的图像修复方法、基于视频引导的图像修复方法和基于多模态融合的图像修复方法。对比分析了各类方法的原理和优缺点,介绍了常用数据集和评价指标,评估了代表性方法在常用数据集上的性能表现,并对该领域目前存在的挑战和未来的发展方向进行了分析和展望。
-
关键词
图像修复
计算机视觉
深度学习
-
Keywords
image inpainting
computer vision
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-