期刊文献+
共找到138,987篇文章
< 1 2 250 >
每页显示 20 50 100
对教育视觉化现象的审视:缘起、隐忧与应对
1
作者 陈思梦 夏正江 《现代大学教育》 北大核心 2024年第3期30-38,共9页
教育受社会视觉化浪潮的濡染和侵袭并被卷入其中。教育视觉化指社会、学校、教师等观看者借助视觉技术,通过教育机制,创制不同等级和形式的视觉符号赋予被观看者,以使被观看者从不可见的变为可见的。教育视觉化缘于观看者对视觉化生存... 教育受社会视觉化浪潮的濡染和侵袭并被卷入其中。教育视觉化指社会、学校、教师等观看者借助视觉技术,通过教育机制,创制不同等级和形式的视觉符号赋予被观看者,以使被观看者从不可见的变为可见的。教育视觉化缘于观看者对视觉化生存的基本需求,缘于教育视觉化技术的不断发展,缘于教育视觉化符号的象征机制。过度强调教育视觉化,不可避免地会引发一系列教育隐忧:观看者过度的视觉化需求导致教育的外在化;视觉技术对教育的全方位渗透加速教育的透明化;视觉符号对实在内容的替代造成教育的符号化;被观看者对视觉符号的无限追求制造教育的景观化。应对教育视觉化隐忧要破除观看者唯“视觉主义”评价模式,建立立体的教育评价体系;审慎发挥视觉技术的全景透视功能,维护教育的不透明性;转变被观看者外在的教育工具价值至上的观念,关注内在的教育人本价值。 展开更多
关键词 视觉文化 视觉 教育视觉 视觉技术 视觉符号
下载PDF
计算机视觉与图像处理专栏
2
作者 元辉 《中北大学学报(自然科学版)》 CAS 2024年第4期I0002-I0002,共1页
视觉是人类感知世界的最重要方式。视觉信息已成为人们生产、生活不可或缺的要素。据不完全统计,视觉信息已占据互联网信息的80%以上,并仍在快速增长。通过人工智能方法对视觉信号进行处理,进而获取视觉信号中的有效信息,对人们的生产... 视觉是人类感知世界的最重要方式。视觉信息已成为人们生产、生活不可或缺的要素。据不完全统计,视觉信息已占据互联网信息的80%以上,并仍在快速增长。通过人工智能方法对视觉信号进行处理,进而获取视觉信号中的有效信息,对人们的生产、生活具有重要意义。然而,实际应用中,很难实现适配所有应用场景的通用视觉处理算法。因此,视觉处理算法需要依据具体的问题进行设计优化。 展开更多
关键词 计算机视觉 图像处理 人工智能方法 视觉信号 视觉信息 人类感知 互联网信息 视觉处理算法
下载PDF
基于被动视觉的三维重建技术研究进展
3
作者 王兆庆 牛朝一 +4 位作者 佘维 宰光军 梁波 易建锋 李英豪 《郑州大学学报(理学版)》 CAS 北大核心 2024年第5期13-19,共7页
基于被动视觉的三维重建技术方法多样、应用广泛。按照不同的分类方法,对基于被动视觉的三维重建技术研究进展进行了分析总结。首先,根据采集装置的数量进行分类,介绍了基于单目视觉、双目视觉和多目视觉的三维重建技术,并对各种方法的... 基于被动视觉的三维重建技术方法多样、应用广泛。按照不同的分类方法,对基于被动视觉的三维重建技术研究进展进行了分析总结。首先,根据采集装置的数量进行分类,介绍了基于单目视觉、双目视觉和多目视觉的三维重建技术,并对各种方法的优缺点进行比较。其次,根据不同应用方法进行分类,对运动恢复结构法和深度学习法的研究进展进行了阐述。最后,对基于被动视觉的三维重建方法进行了综合对比分析,并对三维重建的应用和发展进行了展望。 展开更多
关键词 三维重建 被动视觉 单目视觉 双目视觉 多目视觉 运动恢复结构 深度学习
下载PDF
视觉环境影响手机屏幕视觉表现的研究综述
4
作者 何荥 文栋焱 《照明工程学报》 2024年第5期84-93,共10页
随着手机的迅速普及,其使用时长、频次及场景均有显著增长。不同的视觉环境对视觉感知产生差异化的影响,进而导致不同的视觉表现。长期在不适宜的视觉环境下使用手机,会加大人眼视觉负荷,对手机屏幕的视觉呈现效果及人眼健康构成潜在威... 随着手机的迅速普及,其使用时长、频次及场景均有显著增长。不同的视觉环境对视觉感知产生差异化的影响,进而导致不同的视觉表现。长期在不适宜的视觉环境下使用手机,会加大人眼视觉负荷,对手机屏幕的视觉呈现效果及人眼健康构成潜在威胁。因此,深入探讨手机使用时的视觉环境因素,对于提升手机屏幕的视觉表现具有重要意义。基于此,本文回顾了已有文献中的研究,凝练了视觉环境中各要素的概念特性,并从光环境和手机视觉界面两个维度出发,系统梳理了视觉环境对视觉舒适度、视觉疲劳以及视觉功效的影响机制。通过梳理发现虽然研究对象已由单一环境参数逐步拓展到多环境参数的交互研究,但现有研究在周边视野和亮度感知等方面仍存在局限,在一定程度上制约了对视觉环境与手机屏幕视觉表现之间复杂关系的全面理解。因此,本文结合当前手机使用场景的多样性和光环境测量技术的最新进展,提出研究新趋势,为未来研究提供新的视角,推动相关研究更加全面和深入地发展。 展开更多
关键词 视觉环境 手机 光环境 视觉表现 视觉舒适度
下载PDF
视觉说服社会计算的理论体系与范式创新
5
作者 田丽 陈馨婕 汪子翔 《青年记者》 2024年第5期58-63,共6页
传统说服学关注沟通效果,研究影响说服效果的说服主体、形式、策略等,但是既往的研究大多关注的是话语诠释的说服策略。随着直播、短视频、微短剧等视觉传播的兴起,视觉说服无论在应用传播还是传播理论研究方面都更具价值,计算机视觉的... 传统说服学关注沟通效果,研究影响说服效果的说服主体、形式、策略等,但是既往的研究大多关注的是话语诠释的说服策略。随着直播、短视频、微短剧等视觉传播的兴起,视觉说服无论在应用传播还是传播理论研究方面都更具价值,计算机视觉的发展为视觉说服研究提供了更多的便利。本研究旨在梳理视觉说服的社会计算研究的发展现状、理论体系特征以及研究范式革新,以期为学界和业界提供新的理论洞见和研究路径,推动视觉说服研究进一步发展。 展开更多
关键词 视觉说服 社会计算 视觉传播 计算机视觉 说服效果
下载PDF
社会科学视域下的计算机视觉研究:历史、理论与方法
6
作者 张伦 樊嘉 吴晔 《新媒体与网络》 2024年第2期24-39,共16页
计算机视觉技术发展迅速,为社会科学研究者挖掘视觉数据、研究人类行为、发现新的理论“绿洲”提供了新的路径。通过系统梳理当前与计算机视觉技术相关的社会科学文献,分析总结该领域的发轫历史、发展趋势、关注议题、相关理论概念以及... 计算机视觉技术发展迅速,为社会科学研究者挖掘视觉数据、研究人类行为、发现新的理论“绿洲”提供了新的路径。通过系统梳理当前与计算机视觉技术相关的社会科学文献,分析总结该领域的发轫历史、发展趋势、关注议题、相关理论概念以及研究方法,发现计算机视觉研究主要涉及的理论包括视觉效果相关理论、自我认知相关理论、社会交往相关理论和心理学相关理论四类;研究议题包括政治学、媒体传播、群体行为、区域与人口研究四大方向。在方法上,社交媒体是构成计算机视觉研究最主要的数据来源,主要分析工具包括开源工具、商业平台应用程序接口(API)和研究者自己开发的工具,涵盖12种视觉分析技术。在此基础上,从计算机视觉研究为中国社会科学跨学科研究带来的新契机、计算机视觉研究的理论困境、视觉变量的测量信度与效度以及视频数据获取和使用的伦理问题四个层面,对社会科学视域下的计算机视觉研究进行了反思。 展开更多
关键词 计算机视觉 社会科学研究 视觉效果 自我认知 社会交往 社交媒体 视觉变量测量 开源工具
下载PDF
大模型时代:电力视觉技术新起点 被引量:4
7
作者 赵振兵 冯烁 +3 位作者 席悦 张靖梁 翟永杰 赵文清 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期1813-1825,共13页
随着无人机、巡检机器人和远程监控系统在输电、变电、配电、安监等电力场景中的广泛应用,利用电力视觉技术完成对海量巡检图像的自动处理,能够进一步提升电力系统智能化运维水平,对我国源网荷储一体化进程的快速推进具有至关重要的作... 随着无人机、巡检机器人和远程监控系统在输电、变电、配电、安监等电力场景中的广泛应用,利用电力视觉技术完成对海量巡检图像的自动处理,能够进一步提升电力系统智能化运维水平,对我国源网荷储一体化进程的快速推进具有至关重要的作用。随着通用视觉大模型的兴起,电力视觉技术正处于从传统深度学习时代向大模型时代跨越的重要节点。该文首先综述了电力视觉技术和通用视觉大模型的最新研究进展,结合视觉大模型在多种公共场景的应用先例,探讨视觉大模型在电力视觉领域将面临的3重能力边界问题。从初步探索通用视觉大模型的潜力,到逐步构建电力视觉大模型的过程,提出4种模型应用范式以突破视觉大模型能力边界。最后分析了视觉大模型对电力视觉研究者的影响,并对大模型浪潮下电力视觉技术的发展方向进行了展望。 展开更多
关键词 电力视觉 视觉大模型 目标检测 图像分割 深度学习 图像处理
下载PDF
基于单激光束信息的掘锚装备视觉定位方法研究 被引量:1
8
作者 张旭辉 陈鑫 +3 位作者 杨文娟 雷孟宇 田琛辉 杨骏豪 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第1期311-322,共12页
煤矿井下掘锚装备智能化是改善行业采掘失衡问题的关键,而掘锚装备的精确定位是实现其智能化的前提。与其他传统定位方法相比,基于视觉的位姿测量方法以其无接触、无累计误差的优势在煤矿井下得到了初步的应用。针对目前煤矿井下掘进工... 煤矿井下掘锚装备智能化是改善行业采掘失衡问题的关键,而掘锚装备的精确定位是实现其智能化的前提。与其他传统定位方法相比,基于视觉的位姿测量方法以其无接触、无累计误差的优势在煤矿井下得到了初步的应用。针对目前煤矿井下掘进工作面掘锚装备视觉定位方法存在的合作标靶结构复杂、标定繁琐的问题,结合掘进工作面原有激光指向仪特征,提出一种基于单激光束信息的掘锚装备视觉定位方法。该方法通过分析激光指向仪光斑及光束图像特征,提出了一种基于二维反正切函数拟合的激光光斑中心提取方法和基于Hough直线检测的激光束中心线提取方法,构建了基于点线特征的双目视觉位姿解算模型,得出了掘锚装备在巷道中的实时位姿。最后,为了验证提出的特征提取方法和视觉定位方法的可行性和准确性,在实验室模拟掘进工作面工况环境搭建平台进行了试验。结果表明:基于矿用激光指向仪信息的掘锚装备视觉定位方法具有较高的位姿测量精度。在50 m的测试范围内,机身位置在巷道坐标系下沿X轴、Y轴和Z轴的平均测量误差分别为25.44、58.64、31.08 mm,其最大误差分别为55.16、127.39、63.57 mm;机身姿态在巷道坐标系下的俯仰角、偏航角和横滚角的平均测量误差分别为0.22°、0.22°、0.41°,其最大误差分别为0.29°、0.37°、0.58°。满足煤矿井下巷道施工的定位精度要求。 展开更多
关键词 双目视觉 单激光束 视觉定位 特征提取 掘锚装备
下载PDF
基于计算机视觉的采摘机器人作业优化研究 被引量:1
9
作者 王新科 李凯 《农机化研究》 北大核心 2024年第8期235-239,共5页
为进一步提高我国采摘机器人智能化作业水平及采摘效率,基于计算机视觉应用技术展开优化研究。以采摘机器人结构组成为设计基点,运用视觉控制核心理念建立采摘机器人视觉识别处理与控制数学模型,实施相适应的采摘路径规划和系统采摘状... 为进一步提高我国采摘机器人智能化作业水平及采摘效率,基于计算机视觉应用技术展开优化研究。以采摘机器人结构组成为设计基点,运用视觉控制核心理念建立采摘机器人视觉识别处理与控制数学模型,实施相适应的采摘路径规划和系统采摘状态输出设计。同时,进行视觉采摘验证试验,结果表明:基于计算机视觉的采摘机器人系统优化正确可行,整机综合采摘效率可达94.61%,系统识别准确率与控制精度分别相对提升了6.12%和5.25%,机器人采摘成功率可提升至95.98%。因此,将计算机视觉处理技术有效应用至采摘机器人设计改进,对于类似农业采摘与收获装备开发研究可提供创新及借鉴思路,推广价值良好。 展开更多
关键词 采摘机器人 计算机视觉 视觉控制 识别准确率 采摘成功率
下载PDF
基于视觉传达探索影像视觉元素与纸质包装设计的融合 被引量:2
10
作者 王惠英 《中国造纸》 CAS 北大核心 2024年第4期I0032-I0032,共1页
当今社会,视觉传达设计在商品营销中发挥着至关重要的作用。特别是纸质包装设计,其不仅是保护商品的“外衣”,更是商品传达自身价值和特色的重要媒介。影像视觉元素作为视觉传达设计的核心,其与纸质包装设计的融合更是为商品带来了新的... 当今社会,视觉传达设计在商品营销中发挥着至关重要的作用。特别是纸质包装设计,其不仅是保护商品的“外衣”,更是商品传达自身价值和特色的重要媒介。影像视觉元素作为视觉传达设计的核心,其与纸质包装设计的融合更是为商品带来了新的生命和价值。本文将围绕影像视觉元素与纸质包装设计融合的有效策略展开论述,旨在为设计师提供新的思路和方法。 展开更多
关键词 有效策略 视觉传达设计 商品营销 影像视觉 设计融合 重要媒介 思路和方法
下载PDF
基于Topsis改进因子分析的公路隧道入口段视觉负荷研究 被引量:1
11
作者 梁波 秦灿 +2 位作者 牛佳安 肖靖航 文森 《中国安全科学学报》 CAS CSCD 北大核心 2024年第1期77-84,共8页
为探究直线公路隧道入口段驾驶者的视觉负荷,首先,通过实车试验采集5种视觉指标,采用Topsis改进因子分析法建立视觉负荷评价模型;然后,分析不同时间及位置下视觉负荷的变化特征,基于构建的视觉负荷曲线提出行车舒适评价标准,并运用已发... 为探究直线公路隧道入口段驾驶者的视觉负荷,首先,通过实车试验采集5种视觉指标,采用Topsis改进因子分析法建立视觉负荷评价模型;然后,分析不同时间及位置下视觉负荷的变化特征,基于构建的视觉负荷曲线提出行车舒适评价标准,并运用已发表数据验证构建负荷模型的泛化能力;最后,通过敏感度分析探究视觉指标对视觉负荷的影响程度。结果表明:当驾驶者位于距洞口-13~55 m(12:00)、-10~49 m(15:00)时,视觉负荷超过临界值(0.906),驾驶者的行车舒适度和安全性极低;洞口驾驶者的视觉负荷值和接近度远大于洞内和洞外;18:00的视觉负荷和接近度远低于12:00和15:00。视觉指标的敏感度参数从大到小依次为注视时间、瞳孔面积、注视次数、扫视幅度、扫视速度。 展开更多
关键词 Topsis改进因子分析 公路隧道入口段 视觉负荷 行车安全 视觉指标
下载PDF
基于仿斑马鱼和仿鹰眼视觉的复杂背景下目标识别 被引量:1
12
作者 徐韵哲 陈建 《集成技术》 2024年第2期39-51,共13页
针对反制无人机识别系统在公共场所内部复杂背景下的无人机识别问题,该文研究了一种基于仿斑马鱼模板匹配视觉识别和仿鹰眼视觉注意的目标识别方法,通过建立不同姿态的无人机模板数据库,采用仿鹰眼视觉搜索机制,结合尺度不变特征变换,... 针对反制无人机识别系统在公共场所内部复杂背景下的无人机识别问题,该文研究了一种基于仿斑马鱼模板匹配视觉识别和仿鹰眼视觉注意的目标识别方法,通过建立不同姿态的无人机模板数据库,采用仿鹰眼视觉搜索机制,结合尺度不变特征变换,将姿态模板图像与目标进行匹配,获得粗略的目标区域。然后计算模板姿态与目标姿态的Hausdorff距离,比较目标姿态相似性,获得最相似姿态。采用仿鹰眼视觉注意机制对遮挡图像进行处理,提高目标识别的显著性。实验结果表明,该方法能够在不同复杂背景下实现无人机的准确识别,与光谱残差的显著性目标识别方法相比,平均运行时间提高23.5%,与差异哈希算法相比,具有更高的结构相似性指数。 展开更多
关键词 无人机识别 斑马鱼视觉 鹰眼视觉 模板匹配 视觉注意机制
下载PDF
基于无人系统的智能视觉控制算法研究
13
作者 苏鹏鉴 马海琴 叶俊明 《电子测量技术》 北大核心 2024年第9期93-97,共5页
无人系统应用范围的急剧扩大,使得视觉感知环境愈加复杂多变,致使传统视觉控制算法难以有效控制视觉传感器获取精准的视觉感知图像,从而影响无人系统的稳定运行,故提出基于无人系统的智能视觉控制算法研究。应用Gamma曲线非线性变换无... 无人系统应用范围的急剧扩大,使得视觉感知环境愈加复杂多变,致使传统视觉控制算法难以有效控制视觉传感器获取精准的视觉感知图像,从而影响无人系统的稳定运行,故提出基于无人系统的智能视觉控制算法研究。应用Gamma曲线非线性变换无人系统视觉感知图像灰度值,再应用灰度世界法来增强图像的对比度。以处理后的图像为基础,计算其图像矩,即空间矩、中心矩和归一化中心矩,以描述图像的全局和局部特性。根据得到的无人系统视觉感知信息,搭建智能视觉控制框架。获取期望图像特征矩阵,提取当前时刻图像特征矩阵,通过基于改进萤火虫算法的极限学习机对摄像机转角进行非线性映射,从而获取智能视觉控制定律,以此消除视觉感知图像误差,实现智能视觉的有效控制。实验结果显示:在不同实验组别背景下,应用提出算法获得的视觉控制平均时间最小值达到了1 s,视觉控制平均误差最小值达到了0.12%,充分证实了提出算法的应用性能更佳。 展开更多
关键词 视觉感知技术 无人系统 控制策略 视觉图像处理 视觉伺服控制 控制性能测试
下载PDF
微波视觉与SAR图像智能解译 被引量:1
14
作者 徐丰 金亚秋 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期285-306,共22页
高分辨率雷达成像技术和人工智能、大数据技术的快速发展,有力促进了雷达图像智能解译技术的进步。由于雷达传感器本身的特殊性和电磁散射成像物理的复杂性,雷达图像的解译缺乏光学图像的直观性,准确迅速识别分类的需求对雷达图像解译... 高分辨率雷达成像技术和人工智能、大数据技术的快速发展,有力促进了雷达图像智能解译技术的进步。由于雷达传感器本身的特殊性和电磁散射成像物理的复杂性,雷达图像的解译缺乏光学图像的直观性,准确迅速识别分类的需求对雷达图像解译提出了迫切的挑战。在借鉴人脑光视觉感知机理和计算机视觉图像处理相关技术基础上,进一步融合电磁散射物理规律及其雷达成像机理,我们提出发展微波域雷达图像解译的“微波视觉”的新交叉领域研究。该文介绍微波视觉的概念与内涵,提出微波视觉认知模型,阐述其基础理论问题与技术路线,最后介绍了作者团队在相关问题上的初步研究进展。 展开更多
关键词 合成孔径雷达(SAR) 雷达成像 电磁散射 目标识别 微波视觉 语义电磁散射建模 物理智能 逆问题 视觉感知
下载PDF
图像语义信息在视觉SLAM中的应用研究进展
15
作者 郭迟 刘阳 +2 位作者 罗亚荣 刘经南 张全 《测绘学报》 EI CSCD 北大核心 2024年第6期1057-1076,共20页
视觉同步定位与建图(visual simultaneous localization and mapping,VSLAM)技术以相机为主要传感器采集图像数据,基于多视几何、状态估计等算法原理获取载体的位置和姿态,同时构建一张用于导航定位的地图。视觉SLAM是自动驾驶、AR(augm... 视觉同步定位与建图(visual simultaneous localization and mapping,VSLAM)技术以相机为主要传感器采集图像数据,基于多视几何、状态估计等算法原理获取载体的位置和姿态,同时构建一张用于导航定位的地图。视觉SLAM是自动驾驶、AR(augmented reality)、VR(virtual reality)、MR(mix reality)、智能机器人、无人机飞控中的关键技术。近年来,随着各个产业对智能导航定位的需求日渐增多,原本以几何测量为主的视觉SLAM逐渐融入对环境的语义理解。语义信息是指能够被人类直观感受和理解的概念,而图像语义信息是指图像中物体的轮廓、类别、显著性等信息。相比于图像中的几何特征,语义信息更具时空一致性,且更贴近人类感知的结果。将图像语义信息引入视觉SLAM,既能促进系统各个模块的性能,还能够提升视觉SLAM的智能感知能力,形成集几何测量、定位定姿、环境理解等多种功能的视觉语义SLAM。本文根据图像语义信息的应用方式,对视觉语义SLAM经典方案和最新研究进展进行归纳梳理。在此基础上,本文总结了视觉语义SLAM的现存问题与挑战,指出该领域未来的研究方向,以推动其面向智能导航定位进一步发展。 展开更多
关键词 视觉SLAM 视觉语义SLAM 深度学习 智能导航定位
下载PDF
认知视角下包装视觉信息传达效果的评价研究 被引量:1
16
作者 韦艳丽 徐依晴 胡伟婷 《中国包装》 2024年第3期37-40,共4页
分析产品包装中的视觉要素以及视觉要素传达出的信息,基于认知理论,探讨消费者对包装视觉信息的认知活动,从认知活动的认知负荷、认知绩效来研究视觉传达效果的评价方式;将包装信息传达的评价分为主观和客观维度,以量表为方法的主观评... 分析产品包装中的视觉要素以及视觉要素传达出的信息,基于认知理论,探讨消费者对包装视觉信息的认知活动,从认知活动的认知负荷、认知绩效来研究视觉传达效果的评价方式;将包装信息传达的评价分为主观和客观维度,以量表为方法的主观评价和以任务绩效为指标的客观评价方法,将信息获取效果转化为认知效果,两种方式结合用以验证产品包装的信息传达效果,并为包装设计提供一定的指导。 展开更多
关键词 包装视觉信息 视觉信息传达 认知评价 认知绩效
下载PDF
视觉诱发电位评估帕金森病视幻觉视觉传导通路临床价值
17
作者 李向 张琪林 +2 位作者 陈菲 桂浩 戴永萍 《中国神经精神疾病杂志》 CAS CSCD 北大核心 2024年第5期257-262,共6页
目的本研究旨在通过视觉诱发电位(visual evoked potential,VEP)评估帕金森病(Parkinson disease,PD)患者的视觉传导通路完整性,特别是那些伴有视幻觉的患者。方法共纳入76例PD患者,根据是否伴有视幻觉分为两组:伴有视幻觉组24例,无视... 目的本研究旨在通过视觉诱发电位(visual evoked potential,VEP)评估帕金森病(Parkinson disease,PD)患者的视觉传导通路完整性,特别是那些伴有视幻觉的患者。方法共纳入76例PD患者,根据是否伴有视幻觉分为两组:伴有视幻觉组24例,无视幻觉组52例。为控制变量,同时选取22例性别和年龄匹配的健康对照组。所有受试者接受VEP检测,并针对PD患者进行了统一帕金森病评分量表(UPDRS)、Hoehn&Yahr分期(H-Y分期)和简易智能精神状态检查量表(MMSE)评估。结果伴有视幻觉的PD患者N75、P100、N135潜伏期(88.26±10.47)ms、(118.48±8.53)ms、(144.71±9.48)ms较无视幻觉组(79.00±6.96)ms、(108.60±7.01)ms、(135.95±8.21)ms显著延长(P均<0.001),而N75-P100、N135-P100峰峰波幅[4.35(2.73,7.30)μV]、[6.40(4.15,9.90)μV]则较无视幻觉组[7.10(5.28,9.98)μV]、[9.05(6.30,12.60)μV]显著降低,差异有统计学意义(P<0.001,P=0.037)。相关性分析发现,PD视幻觉组中P100潜伏期与H-Y分期及UPDRS-I、UPDRS-II、UPDRS-III总分呈正相关(r=0.537,P=0.007;r=0.635,P=0.001;r=0.594,P=0.004;r=0.558,P=0.005)。结论视幻觉组PD患者的视觉传导通路完整性受损,且随着疾病进展,视觉传导通路可能遭受进一步破坏,影响可能扩展至上行通路以外的脑区。 展开更多
关键词 帕金森病 视幻觉 视觉诱发电位 视觉传导通路 上行通路
下载PDF
可解释的视觉问答研究进展 被引量:1
18
作者 张一飞 孟春运 +2 位作者 蒋洲 栾力 Ernest Domanaanmwi Ganaa 《计算机应用研究》 CSCD 北大核心 2024年第1期10-20,共11页
在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法... 在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法在工业界落地。主要介绍视觉问答任务中的各种可解释性实现方式,并分为了图像解释、文本解释、多模态解释、模块化解释和图解释五类,讨论了各种方法的特点并对其中的一些方法进行了细分。除此之外,还介绍了一些可以增强可解释性的视觉问答数据集,这些数据集主要通过结合外部知识库、标注图片信息等方法来增强可解释性。对现有常用的视觉问答可解释方法进行了总结,最后根据现有视觉问答任务中可解释性方法的不足提出了未来的研究方向。 展开更多
关键词 视觉问答 视觉推理 可解释性 人工智能 自然语言处理 计算机视觉
下载PDF
形状匹配的铁路油罐车罐口视觉定位方法
19
作者 项学智 马竹山 +2 位作者 周宪坤 王路 乔玉龙 《实验室研究与探索》 CAS 北大核心 2024年第5期5-9,共5页
为了克服非均匀光照、车型以及摄像机安装位置等因素造成的罐口定位误差,提出了一种基于形状匹配的铁路油罐车罐口视觉定位方法。利用罐口为标准几何形状的特点,使用标准图像提取罐口边缘并进行形状拟合;将得到的轮廓形状作为图像识别模... 为了克服非均匀光照、车型以及摄像机安装位置等因素造成的罐口定位误差,提出了一种基于形状匹配的铁路油罐车罐口视觉定位方法。利用罐口为标准几何形状的特点,使用标准图像提取罐口边缘并进行形状拟合;将得到的轮廓形状作为图像识别模板,在待搜索图像中使用基于轮廓的归一化互相关查找目标;在搜索过程中对形状模板进行缩放,以兼容不同型号车型罐口;利用图像金字塔技术减小计算量,加快匹配速度。结果表明,所提出的方法满足误差要求,能够应用于工业现场。 展开更多
关键词 机器视觉 视觉定位 形状匹配 铁路油罐车
下载PDF
基于Transformer视觉特征融合的图像描述方法
20
作者 白雪冰 车进 +1 位作者 吴金蔓 陈玉敏 《计算机工程》 CAS CSCD 北大核心 2024年第8期229-238,共10页
现有图像描述方法只利用区域型视觉特征生成描述语句,忽略了网格型视觉特征的重要性,并且均为两阶段方法,从而影响了图像描述的质量。针对该问题,提出一种基于Transformer视觉特征融合的端到端图像描述方法。首先,在特征提取阶段,利用... 现有图像描述方法只利用区域型视觉特征生成描述语句,忽略了网格型视觉特征的重要性,并且均为两阶段方法,从而影响了图像描述的质量。针对该问题,提出一种基于Transformer视觉特征融合的端到端图像描述方法。首先,在特征提取阶段,利用视觉特征提取器提取出区域型视觉特征和网格型视觉特征;其次,在特征融合阶段,通过视觉特征融合模块对区域型视觉特征和网格型视觉特征进行拼接;最后,将所有的视觉特征送入语言生成器中以生成图像描述。该方法各部分均基于Transformer模型实现,实现了一阶段方法。在MS-COCO数据集上的实验结果表明,所提方法能够充分利用区域型视觉特征与网格型视觉特征的优势,BLEU-1、BLEU-4、METEOR、ROUGE-L、CIDEr、SPICE指标分别达到83.1%、41.5%、30.2%、60.1%、140.3%、23.9%,优于目前主流的图像描述方法,能够生成更加准确和丰富的描述语句。 展开更多
关键词 图像描述 区域型视觉特征 网格型视觉特征 Transformer模型 端到端训练
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部