检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到6篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

语义增强图像-文本预训练模型的零样本三维模型分类: 1; 作者丁博张立宝 +1 位作者秦健何勇军《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3314-3323,共10页; 目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法... 展开更多; 关键词 3维模型分类零样本基于对比学习的图像-文本预训练模型语义描述性文本; 下载PDF 职称材料

多模态预训练模型综述被引量：6: 2; 作者王惠茹李秀红 +3 位作者李哲马春明任泽裕杨丹《计算机应用》 CSCD 北大核心 2023年第4期991-1004,共14页; 预训练模型(PTM)通过利用复杂的预训练目标和大量的模型参数,可以有效地获得无标记数据中的丰富知识。而在多模态中,PTM的发展还处于初期。根据具体模态的不同,将目前大多数的多模态PTM分为图像‒文本PTM和视频‒文本PTM;根据数据融合方... 展开更多; 关键词多模态预训练模型图像-文本预训练模型视频-文本预训练模型神经网络单流模型双流模型; 下载PDF 职称材料

结合视觉文本匹配和图嵌入的可见光-红外行人重识别: 3; 作者张红颖樊世钰 +1 位作者罗谦张涛《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3662-3671,共10页; 对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉... 展开更多; 关键词行人重识别跨模态图片-文本对的预训练模型上下文优化图嵌入; 下载PDF 职称材料

基于深度学习模型的智能化科室导诊: 4; 作者顾君杰王蓓 +1 位作者李晓禹邹俊忠《计算机工程与设计》北大核心 2024年第1期153-158,共6页; 为减轻科室导诊人员的工作负荷,对智能化科室导诊的实现方法进行研究。区别于现有的导诊方式,提出一种少参数轻量化的多级科室导诊模型。结合ALBERT预训练解决现有算法参数量过大的问题,并关联多个相关科室,建立ALBERT预训练与Bi-GRU结... 展开更多; 关键词科室导诊多标签文本预训练双向门控循环单元文本分类深度学习自然语言处理; 下载PDF 职称材料

Region-Aware Fashion Contrastive Learning for Unified Attribute Recognition and Composed Retrieval: 5; 作者 WANG Kangping ZHAO Mingbo 《Journal of Donghua University(English Edition)》 CAS 2024年第4期405-415,共11页; Clothing attribute recognition has become an essential technology,which enables users to automatically identify the characteristics of clothes and search for clothing images with similar attributes.However,existing me... 展开更多; 关键词 attribute recognition image retrieval contrastive language-image pre-training(CLIP) image text matching transformer; 下载PDF 职称材料

视觉语言多模态预训练综述被引量：9: 6; 作者张浩宇王天保 +3 位作者李孟择赵洲浦世亮吴飞《中国图象图形学报》 CSCD 北大核心 2022年第9期2652-2682,共31页; 在多模态机器学习领域,为特定任务而制作的人工标注数据昂贵,且不同任务难以进行迁移,从而需要大量重新训练,导致训练多个任务时效率低下、资源浪费。预训练模型通过以自监督为代表的方式进行大规模数据训练,对数据集中不同模态的信息... 展开更多; 关键词多模态机器学习视觉语言多模态预训练自监督学习图像文本预训练视频文本预训练; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	语义增强图像-文本预训练模型的零样本三维模型分类	丁博张立宝秦健何勇军	《电子与信息学报》 EI CAS CSCD 北大核心	2024	0	下载PDF 职称材料
2	多模态预训练模型综述	王惠茹李秀红李哲马春明任泽裕杨丹	《计算机应用》 CSCD 北大核心	2023	6	下载PDF 职称材料
3	结合视觉文本匹配和图嵌入的可见光-红外行人重识别	张红颖樊世钰罗谦张涛	《电子与信息学报》 EI CAS CSCD 北大核心	2024	0	下载PDF 职称材料
4	基于深度学习模型的智能化科室导诊	顾君杰王蓓李晓禹邹俊忠	《计算机工程与设计》北大核心	2024	0	下载PDF 职称材料
5	Region-Aware Fashion Contrastive Learning for Unified Attribute Recognition and Composed Retrieval	WANG Kangping ZHAO Mingbo	《Journal of Donghua University(English Edition)》 CAS	2024	0	下载PDF 职称材料
6	视觉语言多模态预训练综述	张浩宇王天保李孟择赵洲浦世亮吴飞	《中国图象图形学报》 CSCD 北大核心	2022	9	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部