期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于唇重构与三维耦合CNN的多视角音唇一致性判别
1
作者
朱铮宇
罗超
+3 位作者
贺前华
彭炜锋
毛志炜
张顺四
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第5期70-77,共8页
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特...
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。
展开更多
关键词
一致性判别
生成对抗网络
卷积神经网络
正面重构
多模态
下载PDF
职称材料
AI驱动数字化视听内容创新与实体经济发展
2
作者
任少峰
《现代视听》
2023年第8期64-66,共3页
今天我演讲的主题是AI驱动数字化视听内容创新与实体经济发展。我将从行业现状、内容创新和应用、推动实体经济发展等几个方面分享趣丸科技的实践心得和经验。一、AI的行业现状1956年,人工智能概念被首次提出。经过60多年的发展,2017年...
今天我演讲的主题是AI驱动数字化视听内容创新与实体经济发展。我将从行业现状、内容创新和应用、推动实体经济发展等几个方面分享趣丸科技的实践心得和经验。一、AI的行业现状1956年,人工智能概念被首次提出。经过60多年的发展,2017年我国发布《第一代人工智能发展规划》,2020年国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部五部门出台《国家新一代人工智能标准体系建设指南》五部委发布了人工智能的标准。
展开更多
关键词
国家发展改革委
实体经济发展
人工智能
标准体系建设
工业和信息化部
行业现状
AI
实践心得
下载PDF
职称材料
题名
基于唇重构与三维耦合CNN的多视角音唇一致性判别
1
作者
朱铮宇
罗超
贺前华
彭炜锋
毛志炜
张顺四
机构
华南理工大学音频、语音与视觉处理实验室
广东技术师范大学
网络
空间安全学院
广州趣丸网络科技有限公司
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第5期70-77,共8页
基金
国家自然科学基金资助项目(61672173)
国家重点研发计划项目(2018YFB1802200)。
文摘
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。
关键词
一致性判别
生成对抗网络
卷积神经网络
正面重构
多模态
Keywords
consistency judgment
generative adversarial network
convolutional neural network
frontal recon-struction
multi-modal
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
AI驱动数字化视听内容创新与实体经济发展
2
作者
任少峰
机构
广州趣丸网络科技有限公司
出处
《现代视听》
2023年第8期64-66,共3页
文摘
今天我演讲的主题是AI驱动数字化视听内容创新与实体经济发展。我将从行业现状、内容创新和应用、推动实体经济发展等几个方面分享趣丸科技的实践心得和经验。一、AI的行业现状1956年,人工智能概念被首次提出。经过60多年的发展,2017年我国发布《第一代人工智能发展规划》,2020年国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部五部门出台《国家新一代人工智能标准体系建设指南》五部委发布了人工智能的标准。
关键词
国家发展改革委
实体经济发展
人工智能
标准体系建设
工业和信息化部
行业现状
AI
实践心得
分类号
F49 [经济管理—产业经济]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于唇重构与三维耦合CNN的多视角音唇一致性判别
朱铮宇
罗超
贺前华
彭炜锋
毛志炜
张顺四
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
2
AI驱动数字化视听内容创新与实体经济发展
任少峰
《现代视听》
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部