检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于时空Transformer的端到端的视频注视目标检测: 1; 作者彭梦昊王冠 +1 位作者徐浩景圣恩《图像与信号处理》 2024年第2期190-209,共20页; 注视目标检测旨在定位人的注视目标。HGTTR的提出,将Transformer结构用于注视目标检测的任务中,解决了卷积神经网络需要额外的头部探测器的问题,实现了端到端的对头部位置和注视目标的同时检测,并且实现了优于传统的卷积神经网络的性能... 展开更多; 关键词注视目标检测 TRANSFORMER 可变形注意力时序变化建模; 下载PDF 职称材料

基于层次化Conformer的语音合成: 2; 作者吴克伟韩超 +2 位作者孙永宣彭梦昊谢昭《计算机科学》 CSCD 北大核心 2024年第2期161-171,共11页; 语音合成需要将输入语句的文本转换为包含音素、单词和语句的语音信号。现有语音合成方法将语句看作一个整体,难以准确地合成出不同长度的语音信号。通过分析语音信号中蕴含的层次化关系,分别设计基于Conformer的层次化文本编码器和基于... 展开更多; 关键词语音合成文本编码器语音编码器层次化模型 CONFORMER; 下载PDF 职称材料

由粗到精的高保真单目三维人脸重建: 3; 作者景圣恩高添 +3 位作者陶应诚彭梦昊侍亚东王冠《计算机科学与应用》 2024年第4期255-267,共13页; 针对现有单目三维人脸重建方法在细节刻画和身份信息保持方面的不足,本文提出了一种由粗到精的三维人脸重建框架。该框架首先利用从二维人脸图片中提取的特征参数生成初始三维人脸模型,并设计多尺度身份特征提取器捕获个性化特征。然后... 展开更多; 关键词三维人脸重建三维形变模型自监督学习人脸渲染; 下载PDF 职称材料

基于时空采样的视频行为识别: 4; 作者王冠彭梦昊 +2 位作者陶应诚徐浩景圣恩《人工智能与机器人研究》 2024年第2期300-312,共13页; 视频特征包含了行为执行时的时间、空间冗余信息。该信息和行为类别无关,会干扰行为识别,造成行为类别的错误判断。本文提出了一种基于时空采样的视频行为识别模型。模型包括关键帧采样和Token采样的视频Transformer。关键帧采样过程,... 展开更多; 关键词视频行为识别时空采样视频Transformer; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部