期刊文献+
共找到667篇文章
< 1 2 34 >
每页显示 20 50 100
闯入宽屏 VISION FIELD WIDER
1
《数字生活》 2006年第5期38-40,42-43,共5页
房子宽敞了,电视变大了,所有的DVD大片都是宽银幕的,上网改宽带了,腰围也粗了,连买裤子买沙发都得要更宽的。这生活真的“变宽”了,显示器再不换宽屏啊,那可就格格不入了。
关键词 vision field WIDER 宽屏显示器 液晶显示器 黑白响应时间 平均亮度 灰阶响应时间
下载PDF
Reversibility of visual field defects through induction of brain plasticity: vision restoration, recovery and rehabilitation using alternating current stimulation 被引量:8
2
作者 Bernhard A.Sabel Ying Gao Andrea Antal 《Neural Regeneration Research》 SCIE CAS CSCD 2020年第10期1799-1806,共8页
For decades visual field defects were considered irreversible because it was thought that in the visual system the regeneration potential of the neuronal tissues is low.Nevertheless,there is always some potential for ... For decades visual field defects were considered irreversible because it was thought that in the visual system the regeneration potential of the neuronal tissues is low.Nevertheless,there is always some potential for partial recovery of the visual field defect that can be achieved through induction of neuroplasticity.Neuroplasticity refers to the ability of the brain to change its own functional architecture by modulating synaptic efficacy.It is maintained throughout life and just as neurological rehabilitation can improve motor coordination,visual field defects in glaucoma,diabetic retinopathy or optic neuropathy can be improved by inducing neuroplasticity.In ophthalmology many new treatment paradigms have been tested that can induce neuroplastic changes,including non-invasive alternating current stimulation.Treatment with alternating current stimulation(e.g.,30 minutes,daily for 10 days using transorbital electrodes and^10 Hz)activates the entire retina and parts of the brain.Electroencephalography and functional magnetic resonance imaging studies revealed local activation of the visual cortex,global reorganization of functional brain networks,and enhanced blood flow,which together activate neurons and their networks.The future of low vision is optimistic because vision loss is indeed,partially reversible. 展开更多
关键词 alternating current stimulation glaucoma low vision optic nerve REHABILITATION RECOVERY stress vision vision restoration therapy visual field
下载PDF
Structured scene modeling using micro stereo vision system with large field of view
3
作者 颜世莹 朱玉文 +1 位作者 刘佳音 贾云得 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2001年第3期296-299,共4页
This paper presents a method for structured scene modeling using micro stereo vision system with large field of view. The proposed algorithm includes edge detection with Canny detector, line fitting with principle axi... This paper presents a method for structured scene modeling using micro stereo vision system with large field of view. The proposed algorithm includes edge detection with Canny detector, line fitting with principle axis based approach, finding corresponding lines using feature based matching method, and 3D line depth computation. 展开更多
关键词 Index terms structured scene modeling stereo vision wide field of view mobile robot
下载PDF
Evaluation of Behavior of Evacuees on a Floor in a Disaster Situation Using Multi-agent Simulation and Mixed Reality Game: Effectiveness of the Field of Vision and Priority of Referred Objects
4
作者 Keita Sugiura Masahiro Arakawa 《Computer Technology and Application》 2016年第5期227-235,共9页
In this study, we develop a mixed reality game system to investigate characteristics ofjudgrnents of individual players in an evacuation process. The characteristics of judgments of the players that are inferred from ... In this study, we develop a mixed reality game system to investigate characteristics ofjudgrnents of individual players in an evacuation process. The characteristics of judgments of the players that are inferred from the performance of the game are then incorporated into a multi-agent simulation as rules. The behavior of evacuees is evaluated in approximations of real situations, by using the agent simulation including different judgments of evacuees. Using the results of the simulation, effective methods are discussed for achieving the escape of the evacuees within a short time. 展开更多
关键词 Multi-agent simulation mixed reality game system emergency exit sign behavior of evacuees field of vision.
下载PDF
单目三维视觉测量技术研究进展 被引量:1
5
作者 宋乐 路斯莹 侯宇鹏 《传感技术学报》 CAS CSCD 北大核心 2024年第3期365-380,共16页
单目三维视觉测量在视觉测量领域具有低成本、简便性、结构紧凑等优势,是以智能化、网络化制造为特征的先进制造典型技术之一。经过不断发展,单目三维视觉测量技术已成功应用于无人机导航、智能机器人、工业检测、医疗健康等领域,如今... 单目三维视觉测量在视觉测量领域具有低成本、简便性、结构紧凑等优势,是以智能化、网络化制造为特征的先进制造典型技术之一。经过不断发展,单目三维视觉测量技术已成功应用于无人机导航、智能机器人、工业检测、医疗健康等领域,如今呈现出精准化、快捷化、微型化、自动化、动态化等发展趋势。以孔径数量为标准,将单目三维视觉测量技术分为单孔径及多孔径两大类,分别综述两类方法的研究现状和发展历程,重点论述了应用较广的运动恢复结构法(Structure From Motion,SFM)和光场三维测量方法,并对单目三维视觉测量技术的未来方向进行了展望。 展开更多
关键词 单目视觉 三维测量 SFM 光场 综述
下载PDF
基于虚拟现实全视野刺激下便携式眼震视图仪所测视动性眼震参数的可信度研究
6
作者 蔡宏斌 黄藤月 +1 位作者 古扎力努尔·尼扎木丁 孟子程 《世界复合医学》 2024年第2期1-4,27,共5页
目的探究便携式眼震视图仪基于虚拟现实全视野刺激下测得的视动性眼震(optokinetic nystagmus,OKN)参数的可信度。方法单纯随机选取2022年7月—2023年6月兰州大学第二医院纳入的60例健康受试者为研究对象,按照随机数表法分为两组,每组30... 目的探究便携式眼震视图仪基于虚拟现实全视野刺激下测得的视动性眼震(optokinetic nystagmus,OKN)参数的可信度。方法单纯随机选取2022年7月—2023年6月兰州大学第二医院纳入的60例健康受试者为研究对象,按照随机数表法分为两组,每组30例,对照组采用传统全视野刺激眼震视图仪,观察组采用便携式虚拟现实全视野刺激眼震视图仪,对比两组设备的OKN参数数值。结果观察组左眼眼震次数、慢相速度、快相速度、慢相时间、快相时间、增益、慢相速度/快相速度、慢相时间/快相时间为(21.26±4.26)次、(51.23±4.45)°/s、(304.52±12.26)°/s、(280.52±24.26)ms、(50.52±12.26)ms、0.74±0.26、0.18±0.04、6.05±1.26,与对照组对比,差异无统计学意义(t=0.332、0.196、0.545、0.479、0.019、0.310、0.968、0.186,P均>0.05)。两组自发性眼动试验结果对比,差异无统计学意义(P>0.05)。结论虚拟现实全视野刺激下便携式眼震视图仪用于测定OKN参数的可信度较高,与传统全视野刺激眼震视图仪所测得的OKN参数比值差异较小,并且二者所测得的自发性眼震试验结果亦无明显差异,表明便携式眼震视图仪在眼震检查方面具有较高的准确性。 展开更多
关键词 便携式眼震视图仪 虚拟现实技术 全视野 视动性眼震参数
下载PDF
基于声全息法和单目视觉技术的柴油机噪声可视化实现
7
作者 毕玉华 梁加宝 +1 位作者 姚国仲 吴彪 《机械设计与制造》 北大核心 2024年第8期276-281,共6页
柴油机属于多噪声耦合动力装置,其噪声的识别和控制是内燃机研究领域的难点。为实现柴油机噪声的可视化,本研究结合了近场声全息法与单目视觉技术,开发了基于Labview的声像匹配模块,测试系统人机界面友好,并通过已知声源试验验证了声像... 柴油机属于多噪声耦合动力装置,其噪声的识别和控制是内燃机研究领域的难点。为实现柴油机噪声的可视化,本研究结合了近场声全息法与单目视觉技术,开发了基于Labview的声像匹配模块,测试系统人机界面友好,并通过已知声源试验验证了声像匹配模块的正确性。将验证后的测试系统应用于高压共轨柴油机对主/次推力侧声源进行识别,结果表明:在大气压力为80kPa、转速为1800r/min的最大扭矩工况下,主推力侧出现较大辐射噪声的位置为中冷器进气管、曲轴定时齿形带轮、排气管、脚架和涡轮增压器等;次推力侧辐射噪声峰值出现在起动机位置。 展开更多
关键词 近场声全息 单目视觉系统 声像匹配 柴油机
下载PDF
基于ViT-改进YOLOv7的稻田杂草识别
8
作者 陈学深 吴昌鹏 +4 位作者 党佩娜 张恩造 陈彦学 汤存耀 齐龙 《农业工程学报》 EI CAS CSCD 北大核心 2024年第10期185-193,共9页
为解决光线遮蔽、藻萍干扰以及稻叶尖形状相似等复杂环境导致稻田杂草识别效果不理想问题,该研究提出一种基于组合深度学习的杂草识别方法。引入MSRCP(multi-scale retinex with color preservation)对图像进行增强,以提高图像亮度及对... 为解决光线遮蔽、藻萍干扰以及稻叶尖形状相似等复杂环境导致稻田杂草识别效果不理想问题,该研究提出一种基于组合深度学习的杂草识别方法。引入MSRCP(multi-scale retinex with color preservation)对图像进行增强,以提高图像亮度及对比度;加入ViT分类网络去除干扰背景,以提高模型在复杂环境下对小目标杂草的识别性能。在YOLOv7模型中主干特征提取网络替换为GhostNet网络,并引入CA注意力机制,以增强主干特征提取网络对杂草特征提取能力及简化模型参数计算量。消融试验表明:改进后的YOLOv7模型平均精度均值为88.2%,较原YOLOv7模型提高了3.3个百分点,参数量减少10.43 M,计算量减少66.54×109次/s。识别前先经过MSRCP图像增强后,与原模型相比,改进YOLOv7模型的平均精度均值提高了2.6个百分点,光线遮蔽、藻萍干扰以及稻叶尖形状相似的复杂环境下平均精度均值分别提高5.3、3.6、3.1个百分点,加入ViT分类网络后,较原模型平均精度均值整体提升了4.4个百分点,光线遮蔽、藻萍干扰一级稻叶尖形状相似的复杂环境下的平均精度均值较原模型整体提升了6.2、6.1、5.7个百分点。ViT-改进YOLOv7模型的平均精度均值为92.6%,相比于YOLOv5s、YOLOXs、MobilenetV3-YOLOv7、YOLOv8和改进YOLOv7分别提高了11.6、10.1、5.0、4.2、4.4个百分点。研究结果可为稻田复杂环境的杂草精准识别提供支撑。 展开更多
关键词 机器视觉 深度学习 YOLOv7 VIT 稻田杂草 识别
下载PDF
基于改进YOLO v5n的工厂化育秧田间铺盘装置设计与试验
9
作者 虞佳佳 李玉 +3 位作者 周延锁 胡万里 郝帅 李雷 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期71-80,116,共11页
针对目前工厂化育秧育苗田间铺盘自动化程度低、成本高等问题,设计了一种全自动双边轨道式田间铺盘装置,并配备苗床异常凸起视觉检测模块。首先对铺盘结构工作原理进行分析,之后对铺盘装置满载作业状况进行结构设计、受力分析和仿真分... 针对目前工厂化育秧育苗田间铺盘自动化程度低、成本高等问题,设计了一种全自动双边轨道式田间铺盘装置,并配备苗床异常凸起视觉检测模块。首先对铺盘结构工作原理进行分析,之后对铺盘装置满载作业状况进行结构设计、受力分析和仿真分析。为了防止苗床异常凸起导致铺盘时秧盘倾斜,影响炼苗成活率,提出了一种基于CBAM-YOLO v5n的苗床异常凸起目标识别算法,改进后的YOLO v5n算法添加了注意力机制,对苗床异常凸起目标检测准确率、召回率和平均精度均值分别为98.1%、91.7%和94.9%,相对于原模型分别提高1.2、1.7、0.9个百分点。对设计的铺盘样机进行了正交试验,试验结果表明,当铺盘高度为90 mm、铺盘机构转速为550 r/min、铺盘箱平移速度为0.14 m/s时,铺盘成功率最高为96.4%,植入机器视觉模块后,铺盘成功率可达99.3%。设计的铺盘装置可有效降低人工铺盘劳动强度,降低铺盘劳动成本。 展开更多
关键词 田间铺盘 工厂化育秧 双边轨道式 机器视觉 YOLO v5n
下载PDF
一种大视场汇聚型双目立体视觉标定方法
10
作者 崔帅华 余磊 +2 位作者 何茜 熊邦书 欧巧凤 《应用科学学报》 CAS CSCD 北大核心 2024年第2期269-279,共11页
双目摄像机汇聚型摆放易导致标记点出现散焦模糊和透视形变,使标记点定位出现偏差,在大视场环境下会引发不可忽视的标定误差,进而影响测量精度。为解决上述问题,提出了一种基于标记点定位偏差度加权的大视场汇聚型双目立体视觉标定方法... 双目摄像机汇聚型摆放易导致标记点出现散焦模糊和透视形变,使标记点定位出现偏差,在大视场环境下会引发不可忽视的标定误差,进而影响测量精度。为解决上述问题,提出了一种基于标记点定位偏差度加权的大视场汇聚型双目立体视觉标定方法。首先,利用靶标在摄像机坐标系下的位姿,计算标记点散焦模糊量和透视形变度;其次,根据标记点定位偏差度设置相应权重;最后,将标记点权重系数加入目标函数,引导标定参数优化。实验结果表明:在观测值为505 mm的情况下,该方法测距均方根误差和标准差可达0.809和0.290,不但有效提高了大视场汇聚型双目立体视觉标定精度,而且具有良好的稳定性。 展开更多
关键词 立体视觉 汇聚型双目标定 大视场 定位偏差 加权优化
下载PDF
一种基于场景重建的新视角下视频合成方法
11
作者 刘林峰 丁濛 《北京信息科技大学学报(自然科学版)》 2024年第4期55-62,共8页
针对多视角视频中少量视角前提下的动态场景,提出了一种新视角下的视频合成方法。该方法基于三维高斯抛雪球算法及一系列衍生模型,使用三维高斯函数为体素拟合静态标准场景,结合K-Planes作为变形场,并引入图像的深度信息,最终拟合动态... 针对多视角视频中少量视角前提下的动态场景,提出了一种新视角下的视频合成方法。该方法基于三维高斯抛雪球算法及一系列衍生模型,使用三维高斯函数为体素拟合静态标准场景,结合K-Planes作为变形场,并引入图像的深度信息,最终拟合动态场景。实验结果表明,该方法能够稳定地生成过渡视角视频,为视频处理和影视拍摄领域的视角变换效果提供了有效的解决方案。 展开更多
关键词 计算机视觉 神经辐射场 新视角合成
下载PDF
融入几何先验的圆柱表面三维应变场双目视觉测量方法
12
作者 张一鸣 李广 +2 位作者 徐自力 王珺 闫松 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第6期162-173,共12页
针对现有基于双目视觉的圆柱表面三维应变场测量方法从位移场计算应变场效率低下的问题,将圆柱结构几何先验信息融入子域投影法理论,利用圆柱标准坐标变换替代大量冗余的局部切平面最小二乘拟合求解,提出了一种融合圆柱拟合和子域投影... 针对现有基于双目视觉的圆柱表面三维应变场测量方法从位移场计算应变场效率低下的问题,将圆柱结构几何先验信息融入子域投影法理论,利用圆柱标准坐标变换替代大量冗余的局部切平面最小二乘拟合求解,提出了一种融合圆柱拟合和子域投影的表面三维应变场计算方法;然后采用数值模拟方式,在不同应变区域和位移场噪声条件下,将所提方法与一般曲面子域投影法进行对比分析;最后开展圆柱拉伸实验,分别从单点和全场两个角度将所提方法的应变计算结果与应变片测量结果进行了对比。研究结果表明:在保证计算精度和位移场噪声鲁棒性的同时,所提方法将计算效率提高了约20%,且与应变片实验测量结果吻合较好,验证了该方法能够实现圆柱结构表面三维应变场的高效测量,也为规则结构表面三维应变场的计算提供了新思路。 展开更多
关键词 双目视觉 子域投影 三维应变场 圆柱拟合 最小二乘拟合
下载PDF
机器视觉技术在汽车冲压领域的研究和应用 被引量:1
13
作者 覃平平 《汽车实用技术》 2024年第5期139-142,共4页
随着汽车冲压车间的智能化以及生产全流程检测的要求越来越高,机器视觉技术在汽车冲压领域的应用也越来越广泛。文章通过对传统机器视觉算法及深度学习算法的工作原理进行剖析,研究了机器视觉技术在汽车冲压领域的主要应用场景,如缺陷... 随着汽车冲压车间的智能化以及生产全流程检测的要求越来越高,机器视觉技术在汽车冲压领域的应用也越来越广泛。文章通过对传统机器视觉算法及深度学习算法的工作原理进行剖析,研究了机器视觉技术在汽车冲压领域的主要应用场景,如缺陷检测、特征识别等,对实际应用案例中的主要工作流程、算法以及优势进行详细阐述,以促进机器视觉技术在汽车冲压领域的推广应用,并展望机器视觉技术在汽车冲压领域的发展前景。 展开更多
关键词 机器视觉 冲压领域 缺陷检测 特征识别
下载PDF
面向人眼宽视场视觉成像质量的评价方法 被引量:1
14
作者 王杨 隆海燕 贾曦然 《计算机工程与设计》 北大核心 2024年第4期1157-1165,共9页
为考虑边缘视觉的影响,实现对人眼宽视场条件下视觉成像质量的量化,提出一种基于孪生神经网络的多视域成像质量评价方法。构建个性化眼模型,根据波前像差值获得不同视场处的成像图;利用色彩差异分割成像图中的不同区域,将其作为子图像... 为考虑边缘视觉的影响,实现对人眼宽视场条件下视觉成像质量的量化,提出一种基于孪生神经网络的多视域成像质量评价方法。构建个性化眼模型,根据波前像差值获得不同视场处的成像图;利用色彩差异分割成像图中的不同区域,将其作为子图像以样本对的形式输入到孪生神经网络中,提取图像的多维特征;模拟人眼对色彩的差异化感知,对区域图像质量评价值进行加权,得到对整幅图像的质量评价。为验证算法的有效性,在TID2013、LIVE和CSIQ这3个图像数据库上进行实验,其结果表明,该方法对多视场处成像质量的量化评估有良好的性能。 展开更多
关键词 孪生神经网络 图像质量评价 个性化眼模型 色彩差异 边缘视觉 波前像差值 差异化视场成像
下载PDF
基于双波段比色与计算机视觉构建火焰温度场
15
作者 余乐 胡为 +3 位作者 何九宁 黄永融 邓邦林 田荣刚 《大学物理实验》 2024年第3期9-15,共7页
热辐射是大学物理实验教学的重要内容。采用热辐射的双波段比色法与计算机视觉技术,成功设计并搭建了一个用于构建火焰温度场分布模型的实验装置。该装置通过计算机视觉系统采集和匹配不同波段下的火焰热辐射数据,并依据双波段比色法的... 热辐射是大学物理实验教学的重要内容。采用热辐射的双波段比色法与计算机视觉技术,成功设计并搭建了一个用于构建火焰温度场分布模型的实验装置。该装置通过计算机视觉系统采集和匹配不同波段下的火焰热辐射数据,并依据双波段比色法的理论对实验数据进行计算,最终得到了火焰温度场分布模型。同时,还使用Python语言开发了一套自动化采集与计算程序。通过该装置,深入研究了不同因素对火焰温度和温度场分布的影响,并运用所测得的实验数据成功验证了普朗克黑体辐射定律。 展开更多
关键词 双波段比色法 计算机视觉 火焰温度场分布 普朗克黑体辐射定律
下载PDF
基于FPGA的卷积神经网络和视觉Transformer通用加速器
16
作者 李天阳 张帆 +2 位作者 王松 曹伟 陈立 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2663-2672,共10页
针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面... 针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面向FPGA的通用计算映射方法;其次,提出一种非线性与归一化加速单元,为计算机视觉神经网络模型中的多种非线性和归一化操作提供加速支持;然后,在Xilinx XCVU37P FPGA上实现了加速器设计。实验结果表明,所提出的非线性与归一化加速单元在提高吞吐量的同时仅造成很小的精度损失,ResNet-50和ViT-B/16在所提FPGA加速器上的性能分别达到了589.94 GOPS和564.76 GOPS。与GPU实现相比,能效比分别提高了5.19倍和7.17倍;与其他基于FPGA的大规模加速器设计相比,能效比有明显提高,同时计算效率较对比FPGA加速器提高了8.02%~177.53%。 展开更多
关键词 计算机视觉 卷积神经网络 TRANSFORMER FPGA 硬件加速器
下载PDF
基于双目立体视觉数据的波浪场重构研究
17
作者 李蒙 刘曾 《海洋工程》 CSCD 北大核心 2024年第5期157-164,共8页
为及时准确地获取波面信息,建立了基于双目立体视觉的波面重构流程,从二维波面图像中快速获取三维波面分布。使用双目相机拍摄的波面图像对作为原始数据完成相机参数标定,基于加速鲁棒性特征算法、金字塔搜索法和极线约束完成波面特征... 为及时准确地获取波面信息,建立了基于双目立体视觉的波面重构流程,从二维波面图像中快速获取三维波面分布。使用双目相机拍摄的波面图像对作为原始数据完成相机参数标定,基于加速鲁棒性特征算法、金字塔搜索法和极线约束完成波面特征点的提取和立体匹配。最后通过立体矫正、视差图分析及图片后处理优化流程实现波浪场的三维点云重构,并选取重构区域作线性插值划分均匀网格,将三维点云投影至二维波面原始图像完成可视化。研究结果表明,在光照条件良好、风浪等级相对较大的情况下,双目立体视觉模型能够准确提取波面特征点,重建的三维点云能够再现波面,具有使用便捷且成本较低的特点,为后续做波浪等级分析及波高预报的相关研究奠定了基础。 展开更多
关键词 双目立体视觉 波浪场重构 三维点云 加速鲁棒性特征算法 金字塔搜索法
下载PDF
基于视网膜中央视野微动脉瘤预测糖尿病视网膜病变严重程度的可行性
18
作者 邢球 黄晓波 +1 位作者 谢青 彭立 《临床眼科杂志》 2024年第3期203-208,共6页
目的探讨视网膜微动脉瘤(MAs)预测糖尿病视网膜病变(DR)严重程度的可行性。方法回顾性临床研究。纳入我院2020年1月1日至2022年12月31日就诊的2型糖尿病患者100例(100只眼),针对受检眼均进行眼底照相和检眼镜下眼底检查,定量评估视网膜... 目的探讨视网膜微动脉瘤(MAs)预测糖尿病视网膜病变(DR)严重程度的可行性。方法回顾性临床研究。纳入我院2020年1月1日至2022年12月31日就诊的2型糖尿病患者100例(100只眼),针对受检眼均进行眼底照相和检眼镜下眼底检查,定量评估视网膜MAs、出血(Hmas)和硬性渗出(HEs)与DR程度的关系。结果无DR患者的图像中量化的MAs数量可以忽略不计,而轻、中、重度非增生性糖尿病视网膜病变(NPDR)患者的平均MAs数量随着DR严重程度的增加而显著增加。中度和重度NPDR患者均检测到Hmas,红色病变(RLs)代表MAs和Hmas平均值的组合,与单独量化MAs的趋势相同,但由于Hmas的影响,RLs的数值更高。最后,无NPDR或轻度NPDR患者未检出HEs,中度NPDR和重度NPDR患者的HEs值均检出。在所有病例中,不同严重程度的视网膜病变量化差异均有统计学意义。结论在视网膜中心区域的眼底彩色照相(CFP)图像可量化视网膜病变数量,评估DR严重程度,其间存在强大的相关性。此外,MAs和Hmas作为眼底图像中疾病严重程度的可量化变量,可以作为临床试验的相关疗效终点。 展开更多
关键词 视网膜微动脉瘤 糖尿病视网膜病变 视网膜中央视野 预测
下载PDF
Research on Self-Supervised Comparative Learning for Computer Vision
19
作者 Yuanyuan Liu Qianqian Liu 《Journal of Electronic Research and Application》 2021年第3期5-17,共13页
In recent years,self-supervised learning which does not require a large number of manual labels generate supervised signals through the data itself to attain the characterization learning of samples.Self-supervised le... In recent years,self-supervised learning which does not require a large number of manual labels generate supervised signals through the data itself to attain the characterization learning of samples.Self-supervised learning solves the problem of learning semantic features from unlabeled data,and realizes pre-training of models in large data sets.Its significant advantages have been extensively studied by scholars in recent years.There are usually three types of self-supervised learning:"Generative,Contrastive,and GeneTative-Contrastive."The model of the comparative learning method is relatively simple,and the performance of the current downstream task is comparable to that of the supervised learning method.Therefore,we propose a conceptual analysis framework:data augmentation pipeline,architectures,pretext tasks,comparison methods,semisupervised fine-tuning.Based on this conceptual framework,we qualitatively analyze the existing comparative self-supervised learning methods for computer vision,and then further analyze its performance at different stages,and finally summarize the research status of sei supervised comparative learning methods in other fields. 展开更多
关键词 Self-supervised learning Comparative learning Conceptual analysis framework Computer vision field Performance analysis
下载PDF
动态感受野的图像分割神经网络模型
20
作者 刘洋 舒利明 +3 位作者 孔雨秋 杨婉肖 李英平 孔程玉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第9期1375-1383,共9页
针对基于U-Net的分割方法在医学图像分割领域存在的下采样阶段信息丢失,以及因固定尺寸卷积核带来的局部多尺度语义信息提取不足的问题,提出一种动态感受野的神经网络模型.首先通过构建特征递进级联模块,获取编码器多尺度局部语义特征... 针对基于U-Net的分割方法在医学图像分割领域存在的下采样阶段信息丢失,以及因固定尺寸卷积核带来的局部多尺度语义信息提取不足的问题,提出一种动态感受野的神经网络模型.首先通过构建特征递进级联模块,获取编码器多尺度局部语义特征并将其赋值给解码器,提升模型解码阶段图像语义信息修复的效果;然后设计局部视野偏移模块,增强固定尺寸卷积核提取视野内上下文语义信息的能力.在ISIC2018和BUSI癌症图像分割数据集上的实验结果表明,所提模型的IoU指标达到83.92±0.26和70.45±1.70,Dice系数达到91.09±0.23和83.39±1.15,比现有的医学图像分割方法更优. 展开更多
关键词 医学图像分割 动态感受野 特征递进级联 局部视野偏移
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部