期刊文献+
共找到660篇文章
< 1 2 33 >
每页显示 20 50 100
Evaluation of Behavior of Evacuees on a Floor in a Disaster Situation Using Multi-agent Simulation and Mixed Reality Game: Effectiveness of the Field of Vision and Priority of Referred Objects
1
作者 Keita Sugiura Masahiro Arakawa 《Computer Technology and Application》 2016年第5期227-235,共9页
In this study, we develop a mixed reality game system to investigate characteristics ofjudgrnents of individual players in an evacuation process. The characteristics of judgments of the players that are inferred from ... In this study, we develop a mixed reality game system to investigate characteristics ofjudgrnents of individual players in an evacuation process. The characteristics of judgments of the players that are inferred from the performance of the game are then incorporated into a multi-agent simulation as rules. The behavior of evacuees is evaluated in approximations of real situations, by using the agent simulation including different judgments of evacuees. Using the results of the simulation, effective methods are discussed for achieving the escape of the evacuees within a short time. 展开更多
关键词 Multi-agent simulation mixed reality game system emergency exit sign behavior of evacuees field of vision.
下载PDF
Reversibility of visual field defects through induction of brain plasticity: vision restoration, recovery and rehabilitation using alternating current stimulation 被引量:6
2
作者 Bernhard A.Sabel Ying Gao Andrea Antal 《Neural Regeneration Research》 SCIE CAS CSCD 2020年第10期1799-1806,共8页
For decades visual field defects were considered irreversible because it was thought that in the visual system the regeneration potential of the neuronal tissues is low.Nevertheless,there is always some potential for ... For decades visual field defects were considered irreversible because it was thought that in the visual system the regeneration potential of the neuronal tissues is low.Nevertheless,there is always some potential for partial recovery of the visual field defect that can be achieved through induction of neuroplasticity.Neuroplasticity refers to the ability of the brain to change its own functional architecture by modulating synaptic efficacy.It is maintained throughout life and just as neurological rehabilitation can improve motor coordination,visual field defects in glaucoma,diabetic retinopathy or optic neuropathy can be improved by inducing neuroplasticity.In ophthalmology many new treatment paradigms have been tested that can induce neuroplastic changes,including non-invasive alternating current stimulation.Treatment with alternating current stimulation(e.g.,30 minutes,daily for 10 days using transorbital electrodes and^10 Hz)activates the entire retina and parts of the brain.Electroencephalography and functional magnetic resonance imaging studies revealed local activation of the visual cortex,global reorganization of functional brain networks,and enhanced blood flow,which together activate neurons and their networks.The future of low vision is optimistic because vision loss is indeed,partially reversible. 展开更多
关键词 alternating current stimulation glaucoma low vision optic nerve REHABILITATION RECOVERY stress vision vision restoration therapy visual field
下载PDF
闯入宽屏 VISION FIELD WIDER
3
《数字生活》 2006年第5期38-40,42-43,共5页
房子宽敞了,电视变大了,所有的DVD大片都是宽银幕的,上网改宽带了,腰围也粗了,连买裤子买沙发都得要更宽的。这生活真的“变宽”了,显示器再不换宽屏啊,那可就格格不入了。
关键词 vision field WIDER 宽屏显示器 液晶显示器 黑白响应时间 平均亮度 灰阶响应时间
下载PDF
Structured scene modeling using micro stereo vision system with large field of view
4
作者 颜世莹 朱玉文 +1 位作者 刘佳音 贾云得 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2001年第3期296-299,共4页
This paper presents a method for structured scene modeling using micro stereo vision system with large field of view. The proposed algorithm includes edge detection with Canny detector, line fitting with principle axi... This paper presents a method for structured scene modeling using micro stereo vision system with large field of view. The proposed algorithm includes edge detection with Canny detector, line fitting with principle axis based approach, finding corresponding lines using feature based matching method, and 3D line depth computation. 展开更多
关键词 Index terms structured scene modeling stereo vision wide field of view mobile robot
下载PDF
基于虚拟现实全视野刺激下便携式眼震视图仪所测视动性眼震参数的可信度研究
5
作者 蔡宏斌 黄藤月 +1 位作者 古扎力努尔·尼扎木丁 孟子程 《世界复合医学》 2024年第2期1-4,27,共5页
目的探究便携式眼震视图仪基于虚拟现实全视野刺激下测得的视动性眼震(optokinetic nystagmus,OKN)参数的可信度。方法单纯随机选取2022年7月—2023年6月兰州大学第二医院纳入的60例健康受试者为研究对象,按照随机数表法分为两组,每组30... 目的探究便携式眼震视图仪基于虚拟现实全视野刺激下测得的视动性眼震(optokinetic nystagmus,OKN)参数的可信度。方法单纯随机选取2022年7月—2023年6月兰州大学第二医院纳入的60例健康受试者为研究对象,按照随机数表法分为两组,每组30例,对照组采用传统全视野刺激眼震视图仪,观察组采用便携式虚拟现实全视野刺激眼震视图仪,对比两组设备的OKN参数数值。结果观察组左眼眼震次数、慢相速度、快相速度、慢相时间、快相时间、增益、慢相速度/快相速度、慢相时间/快相时间为(21.26±4.26)次、(51.23±4.45)°/s、(304.52±12.26)°/s、(280.52±24.26)ms、(50.52±12.26)ms、0.74±0.26、0.18±0.04、6.05±1.26,与对照组对比,差异无统计学意义(t=0.332、0.196、0.545、0.479、0.019、0.310、0.968、0.186,P均>0.05)。两组自发性眼动试验结果对比,差异无统计学意义(P>0.05)。结论虚拟现实全视野刺激下便携式眼震视图仪用于测定OKN参数的可信度较高,与传统全视野刺激眼震视图仪所测得的OKN参数比值差异较小,并且二者所测得的自发性眼震试验结果亦无明显差异,表明便携式眼震视图仪在眼震检查方面具有较高的准确性。 展开更多
关键词 便携式眼震视图仪 虚拟现实技术 全视野 视动性眼震参数
下载PDF
基于声全息法和单目视觉技术的柴油机噪声可视化实现
6
作者 毕玉华 梁加宝 +1 位作者 姚国仲 吴彪 《机械设计与制造》 北大核心 2024年第8期276-281,共6页
柴油机属于多噪声耦合动力装置,其噪声的识别和控制是内燃机研究领域的难点。为实现柴油机噪声的可视化,本研究结合了近场声全息法与单目视觉技术,开发了基于Labview的声像匹配模块,测试系统人机界面友好,并通过已知声源试验验证了声像... 柴油机属于多噪声耦合动力装置,其噪声的识别和控制是内燃机研究领域的难点。为实现柴油机噪声的可视化,本研究结合了近场声全息法与单目视觉技术,开发了基于Labview的声像匹配模块,测试系统人机界面友好,并通过已知声源试验验证了声像匹配模块的正确性。将验证后的测试系统应用于高压共轨柴油机对主/次推力侧声源进行识别,结果表明:在大气压力为80kPa、转速为1800r/min的最大扭矩工况下,主推力侧出现较大辐射噪声的位置为中冷器进气管、曲轴定时齿形带轮、排气管、脚架和涡轮增压器等;次推力侧辐射噪声峰值出现在起动机位置。 展开更多
关键词 近场声全息 单目视觉系统 声像匹配 柴油机
下载PDF
单目三维视觉测量技术研究进展
7
作者 宋乐 路斯莹 侯宇鹏 《传感技术学报》 CAS CSCD 北大核心 2024年第3期365-380,共16页
单目三维视觉测量在视觉测量领域具有低成本、简便性、结构紧凑等优势,是以智能化、网络化制造为特征的先进制造典型技术之一。经过不断发展,单目三维视觉测量技术已成功应用于无人机导航、智能机器人、工业检测、医疗健康等领域,如今... 单目三维视觉测量在视觉测量领域具有低成本、简便性、结构紧凑等优势,是以智能化、网络化制造为特征的先进制造典型技术之一。经过不断发展,单目三维视觉测量技术已成功应用于无人机导航、智能机器人、工业检测、医疗健康等领域,如今呈现出精准化、快捷化、微型化、自动化、动态化等发展趋势。以孔径数量为标准,将单目三维视觉测量技术分为单孔径及多孔径两大类,分别综述两类方法的研究现状和发展历程,重点论述了应用较广的运动恢复结构法(Structure From Motion,SFM)和光场三维测量方法,并对单目三维视觉测量技术的未来方向进行了展望。 展开更多
关键词 单目视觉 三维测量 SFM 光场 综述
下载PDF
基于ViT-改进YOLOv7的稻田杂草识别
8
作者 陈学深 吴昌鹏 +4 位作者 党佩娜 张恩造 陈彦学 汤存耀 齐龙 《农业工程学报》 EI CAS CSCD 北大核心 2024年第10期185-193,共9页
为解决光线遮蔽、藻萍干扰以及稻叶尖形状相似等复杂环境导致稻田杂草识别效果不理想问题,该研究提出一种基于组合深度学习的杂草识别方法。引入MSRCP(multi-scale retinex with color preservation)对图像进行增强,以提高图像亮度及对... 为解决光线遮蔽、藻萍干扰以及稻叶尖形状相似等复杂环境导致稻田杂草识别效果不理想问题,该研究提出一种基于组合深度学习的杂草识别方法。引入MSRCP(multi-scale retinex with color preservation)对图像进行增强,以提高图像亮度及对比度;加入ViT分类网络去除干扰背景,以提高模型在复杂环境下对小目标杂草的识别性能。在YOLOv7模型中主干特征提取网络替换为GhostNet网络,并引入CA注意力机制,以增强主干特征提取网络对杂草特征提取能力及简化模型参数计算量。消融试验表明:改进后的YOLOv7模型平均精度均值为88.2%,较原YOLOv7模型提高了3.3个百分点,参数量减少10.43 M,计算量减少66.54×109次/s。识别前先经过MSRCP图像增强后,与原模型相比,改进YOLOv7模型的平均精度均值提高了2.6个百分点,光线遮蔽、藻萍干扰以及稻叶尖形状相似的复杂环境下平均精度均值分别提高5.3、3.6、3.1个百分点,加入ViT分类网络后,较原模型平均精度均值整体提升了4.4个百分点,光线遮蔽、藻萍干扰一级稻叶尖形状相似的复杂环境下的平均精度均值较原模型整体提升了6.2、6.1、5.7个百分点。ViT-改进YOLOv7模型的平均精度均值为92.6%,相比于YOLOv5s、YOLOXs、MobilenetV3-YOLOv7、YOLOv8和改进YOLOv7分别提高了11.6、10.1、5.0、4.2、4.4个百分点。研究结果可为稻田复杂环境的杂草精准识别提供支撑。 展开更多
关键词 机器视觉 深度学习 YOLOv7 VIT 稻田杂草 识别
下载PDF
基于改进YOLO v5n的工厂化育秧田间铺盘装置设计与试验
9
作者 虞佳佳 李玉 +3 位作者 周延锁 胡万里 郝帅 李雷 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期71-80,116,共11页
针对目前工厂化育秧育苗田间铺盘自动化程度低、成本高等问题,设计了一种全自动双边轨道式田间铺盘装置,并配备苗床异常凸起视觉检测模块。首先对铺盘结构工作原理进行分析,之后对铺盘装置满载作业状况进行结构设计、受力分析和仿真分... 针对目前工厂化育秧育苗田间铺盘自动化程度低、成本高等问题,设计了一种全自动双边轨道式田间铺盘装置,并配备苗床异常凸起视觉检测模块。首先对铺盘结构工作原理进行分析,之后对铺盘装置满载作业状况进行结构设计、受力分析和仿真分析。为了防止苗床异常凸起导致铺盘时秧盘倾斜,影响炼苗成活率,提出了一种基于CBAM-YOLO v5n的苗床异常凸起目标识别算法,改进后的YOLO v5n算法添加了注意力机制,对苗床异常凸起目标检测准确率、召回率和平均精度均值分别为98.1%、91.7%和94.9%,相对于原模型分别提高1.2、1.7、0.9个百分点。对设计的铺盘样机进行了正交试验,试验结果表明,当铺盘高度为90 mm、铺盘机构转速为550 r/min、铺盘箱平移速度为0.14 m/s时,铺盘成功率最高为96.4%,植入机器视觉模块后,铺盘成功率可达99.3%。设计的铺盘装置可有效降低人工铺盘劳动强度,降低铺盘劳动成本。 展开更多
关键词 田间铺盘 工厂化育秧 双边轨道式 机器视觉 YOLO v5n
下载PDF
人工智能在外科学教育领域的应用前景
10
作者 张磊 张静 《中国继续医学教育》 2024年第15期162-166,共5页
在高等教育中,人工智能和虚拟现实等前沿教育技术被广泛应用于开发虚拟学习资源。因此,人工智能(artificial intelligence,AI)在临床实践中的应用被认为是医学教育中一个很有前景的扩展领域。AI能够基于学习者的表现数据和个性化需求,... 在高等教育中,人工智能和虚拟现实等前沿教育技术被广泛应用于开发虚拟学习资源。因此,人工智能(artificial intelligence,AI)在临床实践中的应用被认为是医学教育中一个很有前景的扩展领域。AI能够基于学习者的表现数据和个性化需求,定制教育路径和提供精准的学习建议。这种个性化的支持不仅增强了教育效果,还可以帮助医师快速地掌握复杂的临床技能和决策能力。AI的4个关键组成部分是机器学习、自然语言处理、人工神经网络和视觉处理,每个部分都在外科学教育中具有潜在的应用前景。在一个医患关系紧张、医学生源相对饱和及手术机会减少的时代,AI还能够分析大量的临床数据,预测患者的康复路径和可能的并发症,为医疗团队提供决策支持。通过优化资源利用和流程管理,AI还有助于降低医疗成本,提供更经济高效的医疗护理服务。文章阐述了目前AI技术的应用及其在促进外科学教育方面的前景。 展开更多
关键词 人工智能 医学教育 外科领域 机器学习 自然语言处理 人工神经网络 计算机视觉
下载PDF
一种基于场景重建的新视角下视频合成方法
11
作者 刘林峰 丁濛 《北京信息科技大学学报(自然科学版)》 2024年第4期55-62,共8页
针对多视角视频中少量视角前提下的动态场景,提出了一种新视角下的视频合成方法。该方法基于三维高斯抛雪球算法及一系列衍生模型,使用三维高斯函数为体素拟合静态标准场景,结合K-Planes作为变形场,并引入图像的深度信息,最终拟合动态... 针对多视角视频中少量视角前提下的动态场景,提出了一种新视角下的视频合成方法。该方法基于三维高斯抛雪球算法及一系列衍生模型,使用三维高斯函数为体素拟合静态标准场景,结合K-Planes作为变形场,并引入图像的深度信息,最终拟合动态场景。实验结果表明,该方法能够稳定地生成过渡视角视频,为视频处理和影视拍摄领域的视角变换效果提供了有效的解决方案。 展开更多
关键词 计算机视觉 神经辐射场 新视角合成
下载PDF
一种大视场汇聚型双目立体视觉标定方法
12
作者 崔帅华 余磊 +2 位作者 何茜 熊邦书 欧巧凤 《应用科学学报》 CAS CSCD 北大核心 2024年第2期269-279,共11页
双目摄像机汇聚型摆放易导致标记点出现散焦模糊和透视形变,使标记点定位出现偏差,在大视场环境下会引发不可忽视的标定误差,进而影响测量精度。为解决上述问题,提出了一种基于标记点定位偏差度加权的大视场汇聚型双目立体视觉标定方法... 双目摄像机汇聚型摆放易导致标记点出现散焦模糊和透视形变,使标记点定位出现偏差,在大视场环境下会引发不可忽视的标定误差,进而影响测量精度。为解决上述问题,提出了一种基于标记点定位偏差度加权的大视场汇聚型双目立体视觉标定方法。首先,利用靶标在摄像机坐标系下的位姿,计算标记点散焦模糊量和透视形变度;其次,根据标记点定位偏差度设置相应权重;最后,将标记点权重系数加入目标函数,引导标定参数优化。实验结果表明:在观测值为505 mm的情况下,该方法测距均方根误差和标准差可达0.809和0.290,不但有效提高了大视场汇聚型双目立体视觉标定精度,而且具有良好的稳定性。 展开更多
关键词 立体视觉 汇聚型双目标定 大视场 定位偏差 加权优化
下载PDF
基于视网膜中央视野微动脉瘤预测糖尿病视网膜病变严重程度的可行性
13
作者 邢球 黄晓波 +1 位作者 谢青 彭立 《临床眼科杂志》 2024年第3期203-208,共6页
目的探讨视网膜微动脉瘤(MAs)预测糖尿病视网膜病变(DR)严重程度的可行性。方法回顾性临床研究。纳入我院2020年1月1日至2022年12月31日就诊的2型糖尿病患者100例(100只眼),针对受检眼均进行眼底照相和检眼镜下眼底检查,定量评估视网膜... 目的探讨视网膜微动脉瘤(MAs)预测糖尿病视网膜病变(DR)严重程度的可行性。方法回顾性临床研究。纳入我院2020年1月1日至2022年12月31日就诊的2型糖尿病患者100例(100只眼),针对受检眼均进行眼底照相和检眼镜下眼底检查,定量评估视网膜MAs、出血(Hmas)和硬性渗出(HEs)与DR程度的关系。结果无DR患者的图像中量化的MAs数量可以忽略不计,而轻、中、重度非增生性糖尿病视网膜病变(NPDR)患者的平均MAs数量随着DR严重程度的增加而显著增加。中度和重度NPDR患者均检测到Hmas,红色病变(RLs)代表MAs和Hmas平均值的组合,与单独量化MAs的趋势相同,但由于Hmas的影响,RLs的数值更高。最后,无NPDR或轻度NPDR患者未检出HEs,中度NPDR和重度NPDR患者的HEs值均检出。在所有病例中,不同严重程度的视网膜病变量化差异均有统计学意义。结论在视网膜中心区域的眼底彩色照相(CFP)图像可量化视网膜病变数量,评估DR严重程度,其间存在强大的相关性。此外,MAs和Hmas作为眼底图像中疾病严重程度的可量化变量,可以作为临床试验的相关疗效终点。 展开更多
关键词 视网膜微动脉瘤 糖尿病视网膜病变 视网膜中央视野 预测
下载PDF
融入几何先验的圆柱表面三维应变场双目视觉测量方法
14
作者 张一鸣 李广 +2 位作者 徐自力 王珺 闫松 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第6期162-173,共12页
针对现有基于双目视觉的圆柱表面三维应变场测量方法从位移场计算应变场效率低下的问题,将圆柱结构几何先验信息融入子域投影法理论,利用圆柱标准坐标变换替代大量冗余的局部切平面最小二乘拟合求解,提出了一种融合圆柱拟合和子域投影... 针对现有基于双目视觉的圆柱表面三维应变场测量方法从位移场计算应变场效率低下的问题,将圆柱结构几何先验信息融入子域投影法理论,利用圆柱标准坐标变换替代大量冗余的局部切平面最小二乘拟合求解,提出了一种融合圆柱拟合和子域投影的表面三维应变场计算方法;然后采用数值模拟方式,在不同应变区域和位移场噪声条件下,将所提方法与一般曲面子域投影法进行对比分析;最后开展圆柱拉伸实验,分别从单点和全场两个角度将所提方法的应变计算结果与应变片测量结果进行了对比。研究结果表明:在保证计算精度和位移场噪声鲁棒性的同时,所提方法将计算效率提高了约20%,且与应变片实验测量结果吻合较好,验证了该方法能够实现圆柱结构表面三维应变场的高效测量,也为规则结构表面三维应变场的计算提供了新思路。 展开更多
关键词 双目视觉 子域投影 三维应变场 圆柱拟合 最小二乘拟合
下载PDF
基于立体视觉的聚焦波作用下方形立柱近场波浪的三维测量
15
作者 李德玉 肖龙飞 +1 位作者 魏汉迪 李琰 《海洋工程》 CSCD 北大核心 2024年第4期78-85,共8页
准确测量结构物的近场波浪演化是研究波浪与结构物相互作用问题的一个重要前提。针对固定方形立柱的聚焦波试验,提出基于立体视觉的近场波浪测量方法。使用轻质泡沫颗粒制成的标记网来标记波面以获得有丰富纹理的波面图像,在立柱前后各... 准确测量结构物的近场波浪演化是研究波浪与结构物相互作用问题的一个重要前提。针对固定方形立柱的聚焦波试验,提出基于立体视觉的近场波浪测量方法。使用轻质泡沫颗粒制成的标记网来标记波面以获得有丰富纹理的波面图像,在立柱前后各布置一个双目系统,全方位覆盖立柱周边区域,重建出聚焦波作用过程中立柱周围的三维波浪场,从空间分布的角度研究波浪爬升的三维演化。从连续图像序列的处理中可提取出波浪时历,与浪高仪的测量结果吻合良好。结果表明,立体视觉方法可以准确重建结构物的近场波浪演化,测量极端波浪下的波浪爬升。 展开更多
关键词 波浪场测量 三维重建 立体视觉 方形立柱 图像分割 聚焦波 波浪爬升
下载PDF
基于双波段比色与计算机视觉构建火焰温度场
16
作者 余乐 胡为 +3 位作者 何九宁 黄永融 邓邦林 田荣刚 《大学物理实验》 2024年第3期9-15,共7页
热辐射是大学物理实验教学的重要内容。采用热辐射的双波段比色法与计算机视觉技术,成功设计并搭建了一个用于构建火焰温度场分布模型的实验装置。该装置通过计算机视觉系统采集和匹配不同波段下的火焰热辐射数据,并依据双波段比色法的... 热辐射是大学物理实验教学的重要内容。采用热辐射的双波段比色法与计算机视觉技术,成功设计并搭建了一个用于构建火焰温度场分布模型的实验装置。该装置通过计算机视觉系统采集和匹配不同波段下的火焰热辐射数据,并依据双波段比色法的理论对实验数据进行计算,最终得到了火焰温度场分布模型。同时,还使用Python语言开发了一套自动化采集与计算程序。通过该装置,深入研究了不同因素对火焰温度和温度场分布的影响,并运用所测得的实验数据成功验证了普朗克黑体辐射定律。 展开更多
关键词 双波段比色法 计算机视觉 火焰温度场分布 普朗克黑体辐射定律
下载PDF
国内紫外像增强器视场瑕疵检测技术研究现状
17
作者 丁习文 程宏昌 +4 位作者 袁渊 张若愚 杨书宁 杨晔 党小刚 《红外技术》 CSCD 北大核心 2024年第2期129-137,共9页
紫外像增强器是一种对紫外辐射敏感的成像器件,视场瑕疵是其成像效果的主要制约因素。目前,视场瑕疵检测技术主要分为人工和机器视觉两种方法。本文首先阐述了视场瑕疵的定义和检测标准。接着从瑕疵交叠靠近、大小和数量特性的角度,分... 紫外像增强器是一种对紫外辐射敏感的成像器件,视场瑕疵是其成像效果的主要制约因素。目前,视场瑕疵检测技术主要分为人工和机器视觉两种方法。本文首先阐述了视场瑕疵的定义和检测标准。接着从瑕疵交叠靠近、大小和数量特性的角度,分析了视场瑕疵检测的难点。随后,重点介绍了紫外像增强器视场瑕疵检测技术的研究现状。结合当前的检测需求和不足,调研了深度学习技术在其他领域的瑕疵检测效果。最后,从理论上进行了可行性分析,并提出了基于深度学习视场瑕疵检测的思路,旨在为紫外像增强器视场瑕疵检测提供一种新的解决方案,推动其向着更加实用、智能化的方向发展。 展开更多
关键词 像增强器 视场瑕疵检测 机器视觉 深度学习
下载PDF
基于Voronoi图与条件随机场的自然场景文本检测方法
18
作者 方炳坤 楚瀛 《计算机应用与软件》 北大核心 2024年第1期119-125,共7页
在自然场景中准确有效地检测文本是一项艰巨的任务,故提出一种基于条件随机场(CRF)框架的场景文本检测方法。通过利用贝叶斯推断估计文本极大值区域的置信度作为一元成本项,通过使用维诺图(Voronoi图)来构建CRF空间邻域信息,从而构建图... 在自然场景中准确有效地检测文本是一项艰巨的任务,故提出一种基于条件随机场(CRF)框架的场景文本检测方法。通过利用贝叶斯推断估计文本极大值区域的置信度作为一元成本项,通过使用维诺图(Voronoi图)来构建CRF空间邻域信息,从而构建图模型,通过最大流算法最小化成本函数区分文本与非文本标记;利用字符的几何特性通过聚类方法聚合成行。实验结果表明,该算法比传统基于最大稳定极值区域(MSER)算法性能有所提高,自然场景文本检测正确率能达到87%。 展开更多
关键词 贝叶斯模型 条件随机场 VORONOI图 计算机视觉 文本检测
下载PDF
基于FPGA的卷积神经网络和视觉Transformer通用加速器
19
作者 李天阳 张帆 +2 位作者 王松 曹伟 陈立 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2663-2672,共10页
针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面... 针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面向FPGA的通用计算映射方法;其次,提出一种非线性与归一化加速单元,为计算机视觉神经网络模型中的多种非线性和归一化操作提供加速支持;然后,在Xilinx XCVU37P FPGA上实现了加速器设计。实验结果表明,所提出的非线性与归一化加速单元在提高吞吐量的同时仅造成很小的精度损失,ResNet-50和ViT-B/16在所提FPGA加速器上的性能分别达到了589.94 GOPS和564.76 GOPS。与GPU实现相比,能效比分别提高了5.19倍和7.17倍;与其他基于FPGA的大规模加速器设计相比,能效比有明显提高,同时计算效率较对比FPGA加速器提高了8.02%~177.53%。 展开更多
关键词 计算机视觉 卷积神经网络 TRANSFORMER FPGA 硬件加速器
下载PDF
基于双目立体视觉数据的波浪场重构研究
20
作者 李蒙 刘曾 《海洋工程》 CSCD 北大核心 2024年第5期157-164,共8页
为及时准确地获取波面信息,建立了基于双目立体视觉的波面重构流程,从二维波面图像中快速获取三维波面分布。使用双目相机拍摄的波面图像对作为原始数据完成相机参数标定,基于加速鲁棒性特征算法、金字塔搜索法和极线约束完成波面特征... 为及时准确地获取波面信息,建立了基于双目立体视觉的波面重构流程,从二维波面图像中快速获取三维波面分布。使用双目相机拍摄的波面图像对作为原始数据完成相机参数标定,基于加速鲁棒性特征算法、金字塔搜索法和极线约束完成波面特征点的提取和立体匹配。最后通过立体矫正、视差图分析及图片后处理优化流程实现波浪场的三维点云重构,并选取重构区域作线性插值划分均匀网格,将三维点云投影至二维波面原始图像完成可视化。研究结果表明,在光照条件良好、风浪等级相对较大的情况下,双目立体视觉模型能够准确提取波面特征点,重建的三维点云能够再现波面,具有使用便捷且成本较低的特点,为后续做波浪等级分析及波高预报的相关研究奠定了基础。 展开更多
关键词 双目立体视觉 波浪场重构 三维点云 加速鲁棒性特征算法 金字塔搜索法
下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部