检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于视觉-语言预训练模型的零样本迁移学习方法综述: 1; 作者孙仁科许靖昊 +2 位作者皇甫志宇李仲年许新征《计算机工程》 CAS CSCD 北大核心 2024年第10期1-15,共15页; 近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能,多模态学习的重要性和必要性逐渐展现出来,其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模... 展开更多; 关键词零样本学习视觉-语言预训练模型零样本迁移多模态计算机视觉; 下载PDF 职称材料

语义增强的零样本甲骨文字符识别: 2; 作者刘宗昊彭文杰 +2 位作者代港黄双萍刘永革《电子学报》 EI CAS CSCD 北大核心 2024年第10期3347-3358,共12页; 甲骨文识别对于了解中国历史和传承中华文化都有重要的价值.目前,人工识别甲骨文需要具备丰富的专家经验并耗费大量的时间,而自动识别甲骨文的方法绝大部分受制于闭集假设,在甲骨文这种陆续发现新字符的现实场景下适用范围受限.为此,有... 展开更多; 关键词甲骨文字识别零样本识别视觉匹配语义增强视觉-语言模型对比学习; 下载PDF 职称材料

一种基于动态时序划分的视频理解方法: 3; 作者董淑慧《电脑知识与技术》 2023年第36期19-21,共3页; 近年来,随着语言-视觉模型的快速发展,结合视觉编码器和大语言模型进行视频理解的方法极大超越了传统的视频行为分类模型。由于大语言模型可以很好地进行信息的归纳和推理,因此可以将视频帧的特征输入大语言模型,从而得到每一帧的场景描... 展开更多; 关键词语言-视觉模型动态时序划分视频切片视频理解; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部