期刊文献+
共找到694篇文章
< 1 2 35 >
每页显示 20 50 100
Automatic diagnosis of diabetic retinopathy using vision transformer based on wide-field optical coherence tomography angiography
1
作者 Zenan Zhou Huanhuan Yu +3 位作者 Jiaqing Zhao Xiangning Wang Qiang Wu Cuixia Dai 《Journal of Innovative Optical Health Sciences》 SCIE EI CSCD 2024年第2期35-44,共10页
Diabetic retinopathy(DR)is one of the major causes of visual impairment in adults with diabetes.Optical coherence tomography angiography(OCTA)is nowadays widely used as the golden criterion for diagnosing DR.Recently,... Diabetic retinopathy(DR)is one of the major causes of visual impairment in adults with diabetes.Optical coherence tomography angiography(OCTA)is nowadays widely used as the golden criterion for diagnosing DR.Recently,wide-field OCTA(WF-OCTA)provided more abundant information including that of the peripheral retinal degenerative changes and it can contribute in accurately diagnosing DR.The need for an automatic DR diagnostic system based on WF-OCTA pictures attracts more and more attention due to the large diabetic population and the prevalence of retinopathy cases.In this study,automatic diagnosis of DR using vision transformer was performed using WF-OCTA images(12 mm×12 mm single-scan)centered on the fovea as the dataset.WF-OCTA images were automatically classified into four classes:No DR,mild nonproliferative diabetic retinopathy(NPDR),moderate to severe NPDR,and proliferative diabetic retinopathy(PDR).The proposed method for detecting DR on the test set achieves accuracy of 99.55%,sensitivity of 99.49%,and specificity of 99.57%.The accuracy of the method for DR staging reaches up to 99.20%,which has been proven to be higher than that attained by classical convolutional neural network models.Results show that the automatic diagnosis of DR based on vision transformer and WF-OCTA pictures is more effective for detecting and staging DR. 展开更多
关键词 Wide field optical coherence tomography angiography diabetic retinopathy vision transformer image classification
下载PDF
Reversibility of visual field defects through induction of brain plasticity: vision restoration, recovery and rehabilitation using alternating current stimulation 被引量:8
2
作者 Bernhard A.Sabel Ying Gao Andrea Antal 《Neural Regeneration Research》 SCIE CAS CSCD 2020年第10期1799-1806,共8页
For decades visual field defects were considered irreversible because it was thought that in the visual system the regeneration potential of the neuronal tissues is low.Nevertheless,there is always some potential for ... For decades visual field defects were considered irreversible because it was thought that in the visual system the regeneration potential of the neuronal tissues is low.Nevertheless,there is always some potential for partial recovery of the visual field defect that can be achieved through induction of neuroplasticity.Neuroplasticity refers to the ability of the brain to change its own functional architecture by modulating synaptic efficacy.It is maintained throughout life and just as neurological rehabilitation can improve motor coordination,visual field defects in glaucoma,diabetic retinopathy or optic neuropathy can be improved by inducing neuroplasticity.In ophthalmology many new treatment paradigms have been tested that can induce neuroplastic changes,including non-invasive alternating current stimulation.Treatment with alternating current stimulation(e.g.,30 minutes,daily for 10 days using transorbital electrodes and^10 Hz)activates the entire retina and parts of the brain.Electroencephalography and functional magnetic resonance imaging studies revealed local activation of the visual cortex,global reorganization of functional brain networks,and enhanced blood flow,which together activate neurons and their networks.The future of low vision is optimistic because vision loss is indeed,partially reversible. 展开更多
关键词 alternating current stimulation glaucoma low vision optic nerve REHABILITATION RECOVERY stress vision vision restoration therapy visual field
下载PDF
Structured scene modeling using micro stereo vision system with large field of view
3
作者 颜世莹 朱玉文 +1 位作者 刘佳音 贾云得 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2001年第3期296-299,共4页
This paper presents a method for structured scene modeling using micro stereo vision system with large field of view. The proposed algorithm includes edge detection with Canny detector, line fitting with principle axi... This paper presents a method for structured scene modeling using micro stereo vision system with large field of view. The proposed algorithm includes edge detection with Canny detector, line fitting with principle axis based approach, finding corresponding lines using feature based matching method, and 3D line depth computation. 展开更多
关键词 Index terms structured scene modeling stereo vision wide field of view mobile robot
下载PDF
Evaluation of Behavior of Evacuees on a Floor in a Disaster Situation Using Multi-agent Simulation and Mixed Reality Game: Effectiveness of the Field of Vision and Priority of Referred Objects
4
作者 Keita Sugiura Masahiro Arakawa 《Computer Technology and Application》 2016年第5期227-235,共9页
In this study, we develop a mixed reality game system to investigate characteristics ofjudgrnents of individual players in an evacuation process. The characteristics of judgments of the players that are inferred from ... In this study, we develop a mixed reality game system to investigate characteristics ofjudgrnents of individual players in an evacuation process. The characteristics of judgments of the players that are inferred from the performance of the game are then incorporated into a multi-agent simulation as rules. The behavior of evacuees is evaluated in approximations of real situations, by using the agent simulation including different judgments of evacuees. Using the results of the simulation, effective methods are discussed for achieving the escape of the evacuees within a short time. 展开更多
关键词 Multi-agent simulation mixed reality game system emergency exit sign behavior of evacuees field of vision.
下载PDF
闯入宽屏 VISION FIELD WIDER
5
《数字生活》 2006年第5期38-40,42-43,共5页
房子宽敞了,电视变大了,所有的DVD大片都是宽银幕的,上网改宽带了,腰围也粗了,连买裤子买沙发都得要更宽的。这生活真的“变宽”了,显示器再不换宽屏啊,那可就格格不入了。
关键词 vision field WIDER 宽屏显示器 液晶显示器 黑白响应时间 平均亮度 灰阶响应时间
下载PDF
单目三维视觉测量技术研究进展 被引量:1
6
作者 宋乐 路斯莹 侯宇鹏 《传感技术学报》 CAS CSCD 北大核心 2024年第3期365-380,共16页
单目三维视觉测量在视觉测量领域具有低成本、简便性、结构紧凑等优势,是以智能化、网络化制造为特征的先进制造典型技术之一。经过不断发展,单目三维视觉测量技术已成功应用于无人机导航、智能机器人、工业检测、医疗健康等领域,如今... 单目三维视觉测量在视觉测量领域具有低成本、简便性、结构紧凑等优势,是以智能化、网络化制造为特征的先进制造典型技术之一。经过不断发展,单目三维视觉测量技术已成功应用于无人机导航、智能机器人、工业检测、医疗健康等领域,如今呈现出精准化、快捷化、微型化、自动化、动态化等发展趋势。以孔径数量为标准,将单目三维视觉测量技术分为单孔径及多孔径两大类,分别综述两类方法的研究现状和发展历程,重点论述了应用较广的运动恢复结构法(Structure From Motion,SFM)和光场三维测量方法,并对单目三维视觉测量技术的未来方向进行了展望。 展开更多
关键词 单目视觉 三维测量 SFM 光场 综述
下载PDF
基于ViT-改进YOLOv7的稻田杂草识别
7
作者 陈学深 吴昌鹏 +4 位作者 党佩娜 张恩造 陈彦学 汤存耀 齐龙 《农业工程学报》 EI CAS CSCD 北大核心 2024年第10期185-193,共9页
为解决光线遮蔽、藻萍干扰以及稻叶尖形状相似等复杂环境导致稻田杂草识别效果不理想问题,该研究提出一种基于组合深度学习的杂草识别方法。引入MSRCP(multi-scale retinex with color preservation)对图像进行增强,以提高图像亮度及对... 为解决光线遮蔽、藻萍干扰以及稻叶尖形状相似等复杂环境导致稻田杂草识别效果不理想问题,该研究提出一种基于组合深度学习的杂草识别方法。引入MSRCP(multi-scale retinex with color preservation)对图像进行增强,以提高图像亮度及对比度;加入ViT分类网络去除干扰背景,以提高模型在复杂环境下对小目标杂草的识别性能。在YOLOv7模型中主干特征提取网络替换为GhostNet网络,并引入CA注意力机制,以增强主干特征提取网络对杂草特征提取能力及简化模型参数计算量。消融试验表明:改进后的YOLOv7模型平均精度均值为88.2%,较原YOLOv7模型提高了3.3个百分点,参数量减少10.43 M,计算量减少66.54×109次/s。识别前先经过MSRCP图像增强后,与原模型相比,改进YOLOv7模型的平均精度均值提高了2.6个百分点,光线遮蔽、藻萍干扰以及稻叶尖形状相似的复杂环境下平均精度均值分别提高5.3、3.6、3.1个百分点,加入ViT分类网络后,较原模型平均精度均值整体提升了4.4个百分点,光线遮蔽、藻萍干扰一级稻叶尖形状相似的复杂环境下的平均精度均值较原模型整体提升了6.2、6.1、5.7个百分点。ViT-改进YOLOv7模型的平均精度均值为92.6%,相比于YOLOv5s、YOLOXs、MobilenetV3-YOLOv7、YOLOv8和改进YOLOv7分别提高了11.6、10.1、5.0、4.2、4.4个百分点。研究结果可为稻田复杂环境的杂草精准识别提供支撑。 展开更多
关键词 机器视觉 深度学习 YOLOv7 VIT 稻田杂草 识别
下载PDF
基于声全息法和单目视觉技术的柴油机噪声可视化实现
8
作者 毕玉华 梁加宝 +1 位作者 姚国仲 吴彪 《机械设计与制造》 北大核心 2024年第8期276-281,共6页
柴油机属于多噪声耦合动力装置,其噪声的识别和控制是内燃机研究领域的难点。为实现柴油机噪声的可视化,本研究结合了近场声全息法与单目视觉技术,开发了基于Labview的声像匹配模块,测试系统人机界面友好,并通过已知声源试验验证了声像... 柴油机属于多噪声耦合动力装置,其噪声的识别和控制是内燃机研究领域的难点。为实现柴油机噪声的可视化,本研究结合了近场声全息法与单目视觉技术,开发了基于Labview的声像匹配模块,测试系统人机界面友好,并通过已知声源试验验证了声像匹配模块的正确性。将验证后的测试系统应用于高压共轨柴油机对主/次推力侧声源进行识别,结果表明:在大气压力为80kPa、转速为1800r/min的最大扭矩工况下,主推力侧出现较大辐射噪声的位置为中冷器进气管、曲轴定时齿形带轮、排气管、脚架和涡轮增压器等;次推力侧辐射噪声峰值出现在起动机位置。 展开更多
关键词 近场声全息 单目视觉系统 声像匹配 柴油机
下载PDF
基于改进YOLO v5n的工厂化育秧田间铺盘装置设计与试验
9
作者 虞佳佳 李玉 +3 位作者 周延锁 胡万里 郝帅 李雷 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期71-80,116,共11页
针对目前工厂化育秧育苗田间铺盘自动化程度低、成本高等问题,设计了一种全自动双边轨道式田间铺盘装置,并配备苗床异常凸起视觉检测模块。首先对铺盘结构工作原理进行分析,之后对铺盘装置满载作业状况进行结构设计、受力分析和仿真分... 针对目前工厂化育秧育苗田间铺盘自动化程度低、成本高等问题,设计了一种全自动双边轨道式田间铺盘装置,并配备苗床异常凸起视觉检测模块。首先对铺盘结构工作原理进行分析,之后对铺盘装置满载作业状况进行结构设计、受力分析和仿真分析。为了防止苗床异常凸起导致铺盘时秧盘倾斜,影响炼苗成活率,提出了一种基于CBAM-YOLO v5n的苗床异常凸起目标识别算法,改进后的YOLO v5n算法添加了注意力机制,对苗床异常凸起目标检测准确率、召回率和平均精度均值分别为98.1%、91.7%和94.9%,相对于原模型分别提高1.2、1.7、0.9个百分点。对设计的铺盘样机进行了正交试验,试验结果表明,当铺盘高度为90 mm、铺盘机构转速为550 r/min、铺盘箱平移速度为0.14 m/s时,铺盘成功率最高为96.4%,植入机器视觉模块后,铺盘成功率可达99.3%。设计的铺盘装置可有效降低人工铺盘劳动强度,降低铺盘劳动成本。 展开更多
关键词 田间铺盘 工厂化育秧 双边轨道式 机器视觉 YOLO v5n
下载PDF
基于虚拟现实全视野刺激下便携式眼震视图仪所测视动性眼震参数的可信度研究
10
作者 蔡宏斌 黄藤月 +1 位作者 古扎力努尔·尼扎木丁 孟子程 《世界复合医学》 2024年第2期1-4,27,共5页
目的探究便携式眼震视图仪基于虚拟现实全视野刺激下测得的视动性眼震(optokinetic nystagmus,OKN)参数的可信度。方法单纯随机选取2022年7月—2023年6月兰州大学第二医院纳入的60例健康受试者为研究对象,按照随机数表法分为两组,每组30... 目的探究便携式眼震视图仪基于虚拟现实全视野刺激下测得的视动性眼震(optokinetic nystagmus,OKN)参数的可信度。方法单纯随机选取2022年7月—2023年6月兰州大学第二医院纳入的60例健康受试者为研究对象,按照随机数表法分为两组,每组30例,对照组采用传统全视野刺激眼震视图仪,观察组采用便携式虚拟现实全视野刺激眼震视图仪,对比两组设备的OKN参数数值。结果观察组左眼眼震次数、慢相速度、快相速度、慢相时间、快相时间、增益、慢相速度/快相速度、慢相时间/快相时间为(21.26±4.26)次、(51.23±4.45)°/s、(304.52±12.26)°/s、(280.52±24.26)ms、(50.52±12.26)ms、0.74±0.26、0.18±0.04、6.05±1.26,与对照组对比,差异无统计学意义(t=0.332、0.196、0.545、0.479、0.019、0.310、0.968、0.186,P均>0.05)。两组自发性眼动试验结果对比,差异无统计学意义(P>0.05)。结论虚拟现实全视野刺激下便携式眼震视图仪用于测定OKN参数的可信度较高,与传统全视野刺激眼震视图仪所测得的OKN参数比值差异较小,并且二者所测得的自发性眼震试验结果亦无明显差异,表明便携式眼震视图仪在眼震检查方面具有较高的准确性。 展开更多
关键词 便携式眼震视图仪 虚拟现实技术 全视野 视动性眼震参数
下载PDF
人工智能在外科学教育领域的应用前景
11
作者 张磊 张静 《中国继续医学教育》 2024年第15期162-166,共5页
在高等教育中,人工智能和虚拟现实等前沿教育技术被广泛应用于开发虚拟学习资源。因此,人工智能(artificial intelligence,AI)在临床实践中的应用被认为是医学教育中一个很有前景的扩展领域。AI能够基于学习者的表现数据和个性化需求,... 在高等教育中,人工智能和虚拟现实等前沿教育技术被广泛应用于开发虚拟学习资源。因此,人工智能(artificial intelligence,AI)在临床实践中的应用被认为是医学教育中一个很有前景的扩展领域。AI能够基于学习者的表现数据和个性化需求,定制教育路径和提供精准的学习建议。这种个性化的支持不仅增强了教育效果,还可以帮助医师快速地掌握复杂的临床技能和决策能力。AI的4个关键组成部分是机器学习、自然语言处理、人工神经网络和视觉处理,每个部分都在外科学教育中具有潜在的应用前景。在一个医患关系紧张、医学生源相对饱和及手术机会减少的时代,AI还能够分析大量的临床数据,预测患者的康复路径和可能的并发症,为医疗团队提供决策支持。通过优化资源利用和流程管理,AI还有助于降低医疗成本,提供更经济高效的医疗护理服务。文章阐述了目前AI技术的应用及其在促进外科学教育方面的前景。 展开更多
关键词 人工智能 医学教育 外科领域 机器学习 自然语言处理 人工神经网络 计算机视觉
下载PDF
融入几何先验的圆柱表面三维应变场双目视觉测量方法
12
作者 张一鸣 李广 +2 位作者 徐自力 王珺 闫松 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第6期162-173,共12页
针对现有基于双目视觉的圆柱表面三维应变场测量方法从位移场计算应变场效率低下的问题,将圆柱结构几何先验信息融入子域投影法理论,利用圆柱标准坐标变换替代大量冗余的局部切平面最小二乘拟合求解,提出了一种融合圆柱拟合和子域投影... 针对现有基于双目视觉的圆柱表面三维应变场测量方法从位移场计算应变场效率低下的问题,将圆柱结构几何先验信息融入子域投影法理论,利用圆柱标准坐标变换替代大量冗余的局部切平面最小二乘拟合求解,提出了一种融合圆柱拟合和子域投影的表面三维应变场计算方法;然后采用数值模拟方式,在不同应变区域和位移场噪声条件下,将所提方法与一般曲面子域投影法进行对比分析;最后开展圆柱拉伸实验,分别从单点和全场两个角度将所提方法的应变计算结果与应变片测量结果进行了对比。研究结果表明:在保证计算精度和位移场噪声鲁棒性的同时,所提方法将计算效率提高了约20%,且与应变片实验测量结果吻合较好,验证了该方法能够实现圆柱结构表面三维应变场的高效测量,也为规则结构表面三维应变场的计算提供了新思路。 展开更多
关键词 双目视觉 子域投影 三维应变场 圆柱拟合 最小二乘拟合
下载PDF
一种大视场汇聚型双目立体视觉标定方法
13
作者 崔帅华 余磊 +2 位作者 何茜 熊邦书 欧巧凤 《应用科学学报》 CAS CSCD 北大核心 2024年第2期269-279,共11页
双目摄像机汇聚型摆放易导致标记点出现散焦模糊和透视形变,使标记点定位出现偏差,在大视场环境下会引发不可忽视的标定误差,进而影响测量精度。为解决上述问题,提出了一种基于标记点定位偏差度加权的大视场汇聚型双目立体视觉标定方法... 双目摄像机汇聚型摆放易导致标记点出现散焦模糊和透视形变,使标记点定位出现偏差,在大视场环境下会引发不可忽视的标定误差,进而影响测量精度。为解决上述问题,提出了一种基于标记点定位偏差度加权的大视场汇聚型双目立体视觉标定方法。首先,利用靶标在摄像机坐标系下的位姿,计算标记点散焦模糊量和透视形变度;其次,根据标记点定位偏差度设置相应权重;最后,将标记点权重系数加入目标函数,引导标定参数优化。实验结果表明:在观测值为505 mm的情况下,该方法测距均方根误差和标准差可达0.809和0.290,不但有效提高了大视场汇聚型双目立体视觉标定精度,而且具有良好的稳定性。 展开更多
关键词 立体视觉 汇聚型双目标定 大视场 定位偏差 加权优化
下载PDF
面向人眼宽视场视觉成像质量的评价方法 被引量:1
14
作者 王杨 隆海燕 贾曦然 《计算机工程与设计》 北大核心 2024年第4期1157-1165,共9页
为考虑边缘视觉的影响,实现对人眼宽视场条件下视觉成像质量的量化,提出一种基于孪生神经网络的多视域成像质量评价方法。构建个性化眼模型,根据波前像差值获得不同视场处的成像图;利用色彩差异分割成像图中的不同区域,将其作为子图像... 为考虑边缘视觉的影响,实现对人眼宽视场条件下视觉成像质量的量化,提出一种基于孪生神经网络的多视域成像质量评价方法。构建个性化眼模型,根据波前像差值获得不同视场处的成像图;利用色彩差异分割成像图中的不同区域,将其作为子图像以样本对的形式输入到孪生神经网络中,提取图像的多维特征;模拟人眼对色彩的差异化感知,对区域图像质量评价值进行加权,得到对整幅图像的质量评价。为验证算法的有效性,在TID2013、LIVE和CSIQ这3个图像数据库上进行实验,其结果表明,该方法对多视场处成像质量的量化评估有良好的性能。 展开更多
关键词 孪生神经网络 图像质量评价 个性化眼模型 色彩差异 边缘视觉 波前像差值 差异化视场成像
下载PDF
基于FPGA的卷积神经网络和视觉Transformer通用加速器
15
作者 李天阳 张帆 +2 位作者 王松 曹伟 陈立 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2663-2672,共10页
针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面... 针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面向FPGA的通用计算映射方法;其次,提出一种非线性与归一化加速单元,为计算机视觉神经网络模型中的多种非线性和归一化操作提供加速支持;然后,在Xilinx XCVU37P FPGA上实现了加速器设计。实验结果表明,所提出的非线性与归一化加速单元在提高吞吐量的同时仅造成很小的精度损失,ResNet-50和ViT-B/16在所提FPGA加速器上的性能分别达到了589.94 GOPS和564.76 GOPS。与GPU实现相比,能效比分别提高了5.19倍和7.17倍;与其他基于FPGA的大规模加速器设计相比,能效比有明显提高,同时计算效率较对比FPGA加速器提高了8.02%~177.53%。 展开更多
关键词 计算机视觉 卷积神经网络 TRANSFORMER FPGA 硬件加速器
下载PDF
动态感受野的图像分割神经网络模型
16
作者 刘洋 舒利明 +3 位作者 孔雨秋 杨婉肖 李英平 孔程玉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第9期1375-1383,共9页
针对基于U-Net的分割方法在医学图像分割领域存在的下采样阶段信息丢失,以及因固定尺寸卷积核带来的局部多尺度语义信息提取不足的问题,提出一种动态感受野的神经网络模型.首先通过构建特征递进级联模块,获取编码器多尺度局部语义特征... 针对基于U-Net的分割方法在医学图像分割领域存在的下采样阶段信息丢失,以及因固定尺寸卷积核带来的局部多尺度语义信息提取不足的问题,提出一种动态感受野的神经网络模型.首先通过构建特征递进级联模块,获取编码器多尺度局部语义特征并将其赋值给解码器,提升模型解码阶段图像语义信息修复的效果;然后设计局部视野偏移模块,增强固定尺寸卷积核提取视野内上下文语义信息的能力.在ISIC2018和BUSI癌症图像分割数据集上的实验结果表明,所提模型的IoU指标达到83.92±0.26和70.45±1.70,Dice系数达到91.09±0.23和83.39±1.15,比现有的医学图像分割方法更优. 展开更多
关键词 医学图像分割 动态感受野 特征递进级联 局部视野偏移
下载PDF
基于立体视觉的聚焦波作用下方形立柱近场波浪的三维测量
17
作者 李德玉 肖龙飞 +1 位作者 魏汉迪 李琰 《海洋工程》 CSCD 北大核心 2024年第4期78-85,共8页
准确测量结构物的近场波浪演化是研究波浪与结构物相互作用问题的一个重要前提。针对固定方形立柱的聚焦波试验,提出基于立体视觉的近场波浪测量方法。使用轻质泡沫颗粒制成的标记网来标记波面以获得有丰富纹理的波面图像,在立柱前后各... 准确测量结构物的近场波浪演化是研究波浪与结构物相互作用问题的一个重要前提。针对固定方形立柱的聚焦波试验,提出基于立体视觉的近场波浪测量方法。使用轻质泡沫颗粒制成的标记网来标记波面以获得有丰富纹理的波面图像,在立柱前后各布置一个双目系统,全方位覆盖立柱周边区域,重建出聚焦波作用过程中立柱周围的三维波浪场,从空间分布的角度研究波浪爬升的三维演化。从连续图像序列的处理中可提取出波浪时历,与浪高仪的测量结果吻合良好。结果表明,立体视觉方法可以准确重建结构物的近场波浪演化,测量极端波浪下的波浪爬升。 展开更多
关键词 波浪场测量 三维重建 立体视觉 方形立柱 图像分割 聚焦波 波浪爬升
下载PDF
一种基于场景重建的新视角下视频合成方法
18
作者 刘林峰 丁濛 《北京信息科技大学学报(自然科学版)》 2024年第4期55-62,共8页
针对多视角视频中少量视角前提下的动态场景,提出了一种新视角下的视频合成方法。该方法基于三维高斯抛雪球算法及一系列衍生模型,使用三维高斯函数为体素拟合静态标准场景,结合K-Planes作为变形场,并引入图像的深度信息,最终拟合动态... 针对多视角视频中少量视角前提下的动态场景,提出了一种新视角下的视频合成方法。该方法基于三维高斯抛雪球算法及一系列衍生模型,使用三维高斯函数为体素拟合静态标准场景,结合K-Planes作为变形场,并引入图像的深度信息,最终拟合动态场景。实验结果表明,该方法能够稳定地生成过渡视角视频,为视频处理和影视拍摄领域的视角变换效果提供了有效的解决方案。 展开更多
关键词 计算机视觉 神经辐射场 新视角合成
下载PDF
基于双波段比色与计算机视觉构建火焰温度场
19
作者 余乐 胡为 +3 位作者 何九宁 黄永融 邓邦林 田荣刚 《大学物理实验》 2024年第3期9-15,共7页
热辐射是大学物理实验教学的重要内容。采用热辐射的双波段比色法与计算机视觉技术,成功设计并搭建了一个用于构建火焰温度场分布模型的实验装置。该装置通过计算机视觉系统采集和匹配不同波段下的火焰热辐射数据,并依据双波段比色法的... 热辐射是大学物理实验教学的重要内容。采用热辐射的双波段比色法与计算机视觉技术,成功设计并搭建了一个用于构建火焰温度场分布模型的实验装置。该装置通过计算机视觉系统采集和匹配不同波段下的火焰热辐射数据,并依据双波段比色法的理论对实验数据进行计算,最终得到了火焰温度场分布模型。同时,还使用Python语言开发了一套自动化采集与计算程序。通过该装置,深入研究了不同因素对火焰温度和温度场分布的影响,并运用所测得的实验数据成功验证了普朗克黑体辐射定律。 展开更多
关键词 双波段比色法 计算机视觉 火焰温度场分布 普朗克黑体辐射定律
下载PDF
基于掩码自编码的农作物病虫害分类方法
20
作者 鞠萍 宋岩 +2 位作者 张英杰 徐一夫 邵杭 《电子科技》 2024年第10期23-29,共7页
作物病虫害使农业生产遭受损失,但仅依靠人工调查难以满足田间需求。基于机器视觉可实现病虫害自动分类,为农业精准高效生产提供保障。然而现有利用深度学习的方法易受刚性卷积感受野影响,数据增强手段低效且样本量匮乏。针对这些问题,... 作物病虫害使农业生产遭受损失,但仅依靠人工调查难以满足田间需求。基于机器视觉可实现病虫害自动分类,为农业精准高效生产提供保障。然而现有利用深度学习的方法易受刚性卷积感受野影响,数据增强手段低效且样本量匮乏。针对这些问题,文中提出一种基于掩码自编码学习范式的农业经济作物病虫害分类方法,来弥补现有技术在识别准确率方面的不足。通过对作物图像随机掩蔽、特征提取和依高维映射的全局重建,所提算法能充分挖掘输入的高阶语义隐式表征,建模同一图像内远距离上下文关系,从而训练鲁棒性更强的模型。通过相对总变分变换消除了高频噪声对预训练特征提取过程的干扰。所提方法与当前基于主流卷积网络的方法的对比结果表明,所提方法可显著提升现有方法的性能,准确率由基于ResNet50基准网络的90.48%提升至95.24%。 展开更多
关键词 机器视觉 深度学习 农业经济作物 病虫害检测 掩码自编码 相对总变分 神经网络 卷积感受野
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部