期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
An Improved High Precision 3D Semantic Mapping of Indoor Scenes from RGB-D Images
1
作者 Jing Xin Kenan Du +1 位作者 Jiale Feng Mao Shan 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第12期2621-2640,共20页
This paper proposes an improved high-precision 3D semantic mapping method for indoor scenes using RGB-D images.The current semantic mapping algorithms suffer from low semantic annotation accuracy and insufficient real... This paper proposes an improved high-precision 3D semantic mapping method for indoor scenes using RGB-D images.The current semantic mapping algorithms suffer from low semantic annotation accuracy and insufficient real-time performance.To address these issues,we first adopt the Elastic Fusion algorithm to select key frames from indoor environment image sequences captured by the Kinect sensor and construct the indoor environment space model.Then,an indoor RGB-D image semantic segmentation network is proposed,which uses multi-scale feature fusion to quickly and accurately obtain object labeling information at the pixel level of the spatial point cloud model.Finally,Bayesian updating is used to conduct incremental semantic label fusion on the established spatial point cloud model.We also employ dense conditional random fields(CRF)to optimize the 3D semantic map model,resulting in a high-precision spatial semantic map of indoor scenes.Experimental results show that the proposed semantic mapping system can process image sequences collected by RGB-D sensors in real-time and output accurate semantic segmentation results of indoor scene images and the current local spatial semantic map.Finally,it constructs a globally consistent high-precision indoor scenes 3D semantic map. 展开更多
关键词 3D semantic map online reconstruction rgb-d images semantic segmentation indoor mobile robot
下载PDF
Detection of the farmland plow areas using RGB-D images with an improved YOLOv5 model
2
作者 Jiangtao Ji Zhihao Han +2 位作者 Kaixuan Zhao Qianwen Li Shucan Du 《International Journal of Agricultural and Biological Engineering》 SCIE 2024年第3期156-165,共10页
Recognition of the boundaries of farmland plow areas has an important guiding role in the operation of intelligent agricultural equipment.To precisely recognize these boundaries,a detection method for unmanned tractor... Recognition of the boundaries of farmland plow areas has an important guiding role in the operation of intelligent agricultural equipment.To precisely recognize these boundaries,a detection method for unmanned tractor plow areas based on RGB-Depth(RGB-D)cameras was proposed,and the feasibility of the detection method was analyzed.This method applied advanced computer vision technology to the field of agricultural automation.Adopting and improving the YOLOv5-seg object segmentation algorithm,first,the Convolutional Block Attention Module(CBAM)was integrated into Concentrated-Comprehensive Convolution Block(C3)to form C3CBAM,thereby enhancing the ability of the network to extract features from plow areas.The GhostConv module was also utilized to reduce parameter and computational complexity.Second,using the depth image information provided by the RGB-D camera combined with the results recognized by the YOLOv5-seg model,the mask image was processed to extract contour boundaries,align the contours with the depth map,and obtain the boundary distance information of the plowed area.Last,based on farmland information,the calculated average boundary distance was corrected,further improving the accuracy of the distance measurements.The experiment results showed that the YOLOv5-seg object segmentation algorithm achieved a recognition accuracy of 99%for plowed areas and that the ranging accuracy improved with decreasing detection distance.The ranging error at 5.5 m was approximately 0.056 m,and the average detection time per frame is 29 ms,which can meet the real-time operational requirements.The results of this study can provide precise guarantees for the autonomous operation of unmanned plowing units. 展开更多
关键词 plow areas rgb-d camera YOLO object segmentation contour boundary average distance
原文传递
Deep Learning-Based 3D Instance and Semantic Segmentation: A Review
3
作者 Siddiqui Muhammad Yasir Hyunsik Ahn 《Journal on Artificial Intelligence》 2022年第2期99-114,共16页
The process of segmenting point cloud data into several homogeneous areas with points in the same region having the same attributes is known as 3D segmentation.Segmentation is challenging with point cloud data due to... The process of segmenting point cloud data into several homogeneous areas with points in the same region having the same attributes is known as 3D segmentation.Segmentation is challenging with point cloud data due to substantial redundancy,fluctuating sample density and lack of apparent organization.The research area has a wide range of robotics applications,including intelligent vehicles,autonomous mapping and navigation.A number of researchers have introduced various methodologies and algorithms.Deep learning has been successfully used to a spectrum of 2D vision domains as a prevailing A.I.methods.However,due to the specific problems of processing point clouds with deep neural networks,deep learning on point clouds is still in its initial stages.This study examines many strategies that have been presented to 3D instance and semantic segmentation and gives a complete assessment of current developments in deep learning-based 3D segmentation.In these approaches’benefits,draw backs,and design mechanisms are studied and addressed.This study evaluates the impact of various segmentation algorithms on competitiveness on various publicly accessible datasets,as well as the most often used pipelines,their advantages and limits,insightful findings and intriguing future research directions. 展开更多
关键词 Artificial intelligence computer vision robot vision 3D instance segmentation 3D semantic segmentation 3D data deep learning point cloud MESH VOXEL rgb-d segmentation
下载PDF
Object Detection in Remote Sensing Images Using Picture Fuzzy Clustering and MapReduce 被引量:1
4
作者 Tran Manh Tuan Tran Thi Ngan Nguyen Tu Trung 《Computer Systems Science & Engineering》 SCIE EI 2022年第12期1241-1253,共13页
In image processing, one of the most important steps is image segmentation. The objects in remote sensing images often have to be detected in order toperform next steps in image processing. Remote sensing images usua... In image processing, one of the most important steps is image segmentation. The objects in remote sensing images often have to be detected in order toperform next steps in image processing. Remote sensing images usually havelarge size and various spatial resolutions. Thus, detecting objects in remote sensing images is very complicated. In this paper, we develop a model to detectobjects in remote sensing images based on the combination of picture fuzzy clustering and MapReduce method (denoted as MPFC). Firstly, picture fuzzy clustering is applied to segment the input images. Then, MapReduce is used to reducethe runtime with the guarantee of quality. To convert data for MapReduce processing, two new procedures are introduced, including Map_PFC and Reduce_PFC.The formal representation and details of two these procedures are presented in thispaper. The experiments on satellite image and remote sensing image datasets aregiven to evaluate proposed model. Validity indices and time consuming are usedto compare proposed model to picture fuzzy clustering model. The values ofvalidity indices show that picture fuzzy clustering integrated to MapReduce getsbetter quality of segmentation than using picture fuzzy clustering only. Moreover,on two selected image datasets, the run time of MPFC model is much less thanthat of picture fuzzy clustering. 展开更多
关键词 Remote sensing images picture fuzzy clustering image segmentation object detection MAPREDUCE
下载PDF
基于社交媒体图片的地震灾情检测语义分割数据集
5
作者 王晓东 杨腾飞 +7 位作者 徐誉宁 明梦如 王含 李连欣 许建楼 张冀 张平 王海军 《中国科学数据(中英文网络版)》 CSCD 2024年第3期395-404,共10页
以社交媒体为代表的志愿者地理数据已成为减灾重要数据源,尤其是其中包含的图片数据,具有很强的灾害态势感知力。但目前对于该数据服务减灾的应用并不多,其主要原因在于具有标注特征的可用图片训练集匮乏,使得包括机器学习、深度学习等... 以社交媒体为代表的志愿者地理数据已成为减灾重要数据源,尤其是其中包含的图片数据,具有很强的灾害态势感知力。但目前对于该数据服务减灾的应用并不多,其主要原因在于具有标注特征的可用图片训练集匮乏,使得包括机器学习、深度学习等技术手段很难发挥作用,从而限制了该类数据反馈灾情信息的能力。本文从实际应用的角度出发,以地震灾害为研究对象,结合包括数据获取、自动化去重、语义标注以及数据增强等方法制作了面向社交媒体图片的灾害语义分割数据集。本数据集主要由社交媒体搜集的原始图片和人工语义标注后的伪彩色图片组成,并采用多人轮番标注以及交叉检验保证数据质量。本数据集对于提高社交媒体数据使用效率以及增强减灾态势感知具有重要作用。 展开更多
关键词 社交媒体 图片 地震灾害 语义分割
下载PDF
基于深度学习的建筑破坏状态智能评估研究
6
作者 黄永 于建琦 +2 位作者 林旭川 钟江荣 李惠 《自然灾害学报》 CSCD 北大核心 2023年第4期148-158,共11页
地震发生后需要对震害区域建筑物破坏等级进行快速评估,以便于震后辅助决策和应急救援。通过分析建筑物外立面震害照片数据,挖掘不同建筑破坏等级与其立面图像特征潜在的映射关系,建立基于震害图像数据的建筑破坏状态智能评估深度学习方... 地震发生后需要对震害区域建筑物破坏等级进行快速评估,以便于震后辅助决策和应急救援。通过分析建筑物外立面震害照片数据,挖掘不同建筑破坏等级与其立面图像特征潜在的映射关系,建立基于震害图像数据的建筑破坏状态智能评估深度学习方法,并应用于都江堰的地震调查数据。首先,训练获得了DeeplabV3+图像语义分割深度神经网络模型,实现在震后复杂背景下的建筑物外观整体的分割提取。进一步,利用迁移学习进行ResNeXt网络参数训练用于图像分类,实现建筑物地震破坏等级的评估。分析了都江堰地震现场调查数据,实验结果表明,所提方法能够较精细地将建筑破坏划分为基本完好、损坏和倒塌三类,准确率达到90.33%。评估模型可直接应用于震后建筑状态的较精细评估,且对外立面图像拍摄角度无较高要求,对图像背景鲁棒,可避免环境因素影响。相较于人工判断,研究方法提高了工作效率,缓解了调查者主观性判断带来的离散性影响,具有良好的应用潜力。 展开更多
关键词 建筑地震破坏 深度学习 震害照片 图像分割 图像分类 卷积神经网络
下载PDF
基于改进型二维Gabor特征的血管图像分割提取方法研究 被引量:1
7
作者 石矛 吉爱红 《中国医疗器械杂志》 2023年第2期124-128,共5页
提出了一种基于改进型Gabor滤波特征的血管分割方法。根据图像中各像素点的Hessian矩阵的特征向量获得各点的血管方向,并依此设置Gabor变换的方向角;提取出各点下不同血管宽度尺度的Gabor特征,建立各点的六维表示向量;通过对六维表示向... 提出了一种基于改进型Gabor滤波特征的血管分割方法。根据图像中各像素点的Hessian矩阵的特征向量获得各点的血管方向,并依此设置Gabor变换的方向角;提取出各点下不同血管宽度尺度的Gabor特征,建立各点的六维表示向量;通过对六维表示向量降维处理,获取各点二维表示向量;将各点二维表示向量经处理后和原图像G通道相融合,并使用U-Net神经网络对融合后的图像进行分类,实现血管分割。对DRIVE视网膜眼底图像数据集中进行实验,发现该方法对细小血管以及交叉点处血管的检测具有较好的效果。 展开更多
关键词 血管分割 图像处理 GABOR特征 t-SNE降维 U-Net
下载PDF
彩色汽车牌照定位方法 被引量:28
8
作者 任仙怡 周晓 +1 位作者 张桂林 张天序 《红外与激光工程》 EI CSCD 北大核心 2002年第3期204-207,共4页
汽车牌照的定位是牌照识别的第一步 ,定位的准确与否将对后续操作起关键性的作用。在模式识别领域中 ,希望通过一种方法就完成一项实际工作是不可能的 ,必须要考虑多种方法融合的策略。提出了一种基于多方法的车牌定位策略。首先利用颜... 汽车牌照的定位是牌照识别的第一步 ,定位的准确与否将对后续操作起关键性的作用。在模式识别领域中 ,希望通过一种方法就完成一项实际工作是不可能的 ,必须要考虑多种方法融合的策略。提出了一种基于多方法的车牌定位策略。首先利用颜色信息对输入图像进行彩色粗分割 ,得到了颜色为车牌照的一些区域。然后将分割结果中的伪目标区域 (即除了车牌照区域外的其他区域 )分为两类 (一类是与汽车牌照颜色相近的背景 ,一类是可能和牌照颜色相近的汽车外壳 ) ,分别进行处理 ,最终利用投影法得到准确的车牌位置。实验结果表明该方法效果较好。 展开更多
关键词 汽车牌照 定位 彩色分割
下载PDF
国内医学图像处理技术的最新动态 被引量:33
9
作者 田娅 饶妮妮 蒲立新 《电子科技大学学报》 EI CAS CSCD 北大核心 2002年第5期485-489,共5页
阐述了医学图像处理技术的发展动态,介绍了目前国内在三维医学图像的可视化和基于PACS的医学图像压缩在医学图像处理方面的进展。在比较各种技术在相关领域中应用的基础上,提出了医学图像处理技术发展所面临的相关问题及其发展方向。
关键词 医学 图像处理技术 可视化 图像分割 图像匹配 图像融合 图像存档通信系统
下载PDF
巧设路由实现ECLIPSE 1.5T MR的直接DICOM传输与打印 被引量:3
10
作者 李国昭 仲纲才 吴旻 《中国医学影像技术》 CSCD 北大核心 2009年第4期698-701,共4页
目的通过在ECLIPSE 1.5T MR工作站中设置路由服务器,实现不同网段之间的直接通信,以实现PACS中同一物理网络不同网段之间医学图像的直接DICOM传输与打印。方法通过为ECLIPSE 1.5T MR工作站安装第二块网卡,打开其操作系统内核的数据包转... 目的通过在ECLIPSE 1.5T MR工作站中设置路由服务器,实现不同网段之间的直接通信,以实现PACS中同一物理网络不同网段之间医学图像的直接DICOM传输与打印。方法通过为ECLIPSE 1.5T MR工作站安装第二块网卡,打开其操作系统内核的数据包转发功能,完成路由服务器的组建工作。结果完成ECLIPSE 1.5T MR主机到PACS网络中图像接收服务器的直接DICOM传输以及实现PACS网络打印。结论ECLIPSE 1.5T MR工作站的Linux操作系统提供路由服务完全可以实现同一物理网络不同网段之间的通信。 展开更多
关键词 医学影像存档与通讯系统 网段 DICOM传输 DICOM打印
下载PDF
基于动静背景下的视频对象自适应提取算法 被引量:6
11
作者 纪腾飞 王世刚 +1 位作者 周茜 杨虹 《吉林大学学报(信息科学版)》 CAS 2007年第1期73-77,共5页
在MPEG-4标准中提出了VOP(Video Object Planes)的概念,可以通过VOP实现基于内容的操作。这样,从场景中自动地分割出视频对象就成为基于对象视频编码的先决条件。为此,提出一种基于动静背景下的视频对象自适应提取算法。该算法可以自动... 在MPEG-4标准中提出了VOP(Video Object Planes)的概念,可以通过VOP实现基于内容的操作。这样,从场景中自动地分割出视频对象就成为基于对象视频编码的先决条件。为此,提出一种基于动静背景下的视频对象自适应提取算法。该算法可以自动提取动态背景、静态背景,也可以在视频序列中出现背景和对象都停止变化时实现视频对象的提取。同时,该算法引入了视频前景和背景预处理,克服了由于视频图像对比度低造成的提取出的部分视频对象轮廓不完整的问题。 展开更多
关键词 视频对象 MPEG-4标准 视频分割 帧间差分 块匹配
下载PDF
医学图像后处理研究进展 被引量:9
12
作者 刘兵全 何继善 +1 位作者 李振伟 涂蓉 《国外医学(生物医学工程分册)》 CAS 2004年第4期248-252,共5页
概要分析和评述了近年来医学图像后处理技术的发展,并主要从图像分割、配准、重建、PACS系统等方面进行了分类综述。
关键词 医学图像 图像分割 图像匹配 三维重建 图像归档与传输系统(PACS)
下载PDF
视频画面分割器的FPGA实现 被引量:2
13
作者 覃永新 章帆 苏珊 《广西工学院学报》 CAS 2010年第2期81-85,共5页
介绍一种在多点视频监控系统中基于FPGA的画面分割器的设计和实现方法,通过对视频画面分割器的系统结构的阐述,以及采用FPGA对ITU656格式的视频信号进行压缩和通过对双端口FIFO的读写操作,完成帧合成的软件设计过程.设计采用了无操作系... 介绍一种在多点视频监控系统中基于FPGA的画面分割器的设计和实现方法,通过对视频画面分割器的系统结构的阐述,以及采用FPGA对ITU656格式的视频信号进行压缩和通过对双端口FIFO的读写操作,完成帧合成的软件设计过程.设计采用了无操作系统的纯硬件结构,利用FPGA的高速并行处理能力的优势,应用灵活的多画面合成方法实现了单屏幕上的实时多画面显示. 展开更多
关键词 视频合成 画面分割 多窗口显示 现场可编程门阵列
下载PDF
基于形态学和蚁群聚类的台风分割方法研究 被引量:1
14
作者 钱华明 满国晶 陈亮 《系统仿真学报》 CAS CSCD 北大核心 2012年第5期1005-1009,共5页
蚁群算法是具有离散性、并行性、鲁棒性、正反馈性等特点的一种仿生进化算法。根据数字图像的离散性特点,从聚类角度出发,将蚁群聚类算法引入到台风云系分割中,并通过引入初始聚类中心和引导函数来解决传统蚁群聚类算法计算量大,搜索时... 蚁群算法是具有离散性、并行性、鲁棒性、正反馈性等特点的一种仿生进化算法。根据数字图像的离散性特点,从聚类角度出发,将蚁群聚类算法引入到台风云系分割中,并通过引入初始聚类中心和引导函数来解决传统蚁群聚类算法计算量大,搜索时间过长的问题。在蚁群聚类算法的基础上,针对单纯采用蚁群聚类算法可能会将类似于台风云系的分布不均匀的无关云团分割出来而造成分割精度低的情况,提出了一种蚁群算法融合数学形态学方法的台风云系分割方法。仿真结果表明此方法可以准确的分割出台风云系,是一种有效的图像分割方法。 展开更多
关键词 数学形态学 蚁群聚类算法 台风分割 卫星云图
下载PDF
图像分割法测量青少年特发性脊柱侧弯Cobb角的可靠性分析 被引量:4
15
作者 谢侠 温运慧 李艳芳 《生命科学仪器》 2021年第3期68-74,共7页
图像处理技术的发展为医学影像提供了新的计算机软件诊断方式,探寻一种对先验知识及个人操作依赖性较低且可获取稳定测量结果的计算机软件测量Cobb角的方式有一定研究意义。文章以我院青少年特发性脊柱侧弯患者的脊柱影像为研究对象,提... 图像处理技术的发展为医学影像提供了新的计算机软件诊断方式,探寻一种对先验知识及个人操作依赖性较低且可获取稳定测量结果的计算机软件测量Cobb角的方式有一定研究意义。文章以我院青少年特发性脊柱侧弯患者的脊柱影像为研究对象,提出一种新型脊柱侧弯测量方法,采用基于图像分割技术的脊柱侧弯Cobb角自动测量算法,首先采用活动轮廓模型方法分割脊柱图像,之后获取各块脊椎的重点,并对它们进行曲线拟合,最后,通过计算脊柱曲线上切线之间的夹角得到Cobb角。经实验验证,该方法Cobb角测量误差小,用时短,能够解决当前Cobb角测量算法中需手动定义脊柱上下端椎的问题,有较高的可靠性与应用价值。 展开更多
关键词 图像分割 特发性脊柱侧弯 Cobb角测量 算法
下载PDF
基于树形图结构模型的人体姿态估计 被引量:6
16
作者 韩贵金 赵勇 《西安邮电学院学报》 2013年第3期83-86,共4页
讨论计算机视觉领域的人体姿态估计问题,基于树形图结构模型提出一种人体姿态估计算法。根据人体目标前景分割图的形状特征给出人体部位外观模型后,利用高斯分布确定人体部位间的结构先验分布,再采用置信传播算法进行人体姿态估计。仿... 讨论计算机视觉领域的人体姿态估计问题,基于树形图结构模型提出一种人体姿态估计算法。根据人体目标前景分割图的形状特征给出人体部位外观模型后,利用高斯分布确定人体部位间的结构先验分布,再采用置信传播算法进行人体姿态估计。仿真结果表明新算法有效。 展开更多
关键词 树形图结构模型 前景分割图 置信传播算法 人体姿态估计
下载PDF
一种基于宏块信息的快速MPEG视频分割算法
17
作者 王学军 刘锟 +1 位作者 刘帅 陈贺新 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第1期197-200,共4页
提出了一种基于宏块信息的快速MPEG压缩视频场景分割算法。该算法只需要通过直接抽取MPEG视频流中的B帧、P帧中的宏块类型信息,并对其进行计算就可以检测出视频中存在的镜头边界,从而对场景变换进行精确定位。这种方法无需对压缩视频进... 提出了一种基于宏块信息的快速MPEG压缩视频场景分割算法。该算法只需要通过直接抽取MPEG视频流中的B帧、P帧中的宏块类型信息,并对其进行计算就可以检测出视频中存在的镜头边界,从而对场景变换进行精确定位。这种方法无需对压缩视频进行解压,所以能够满足实时检测的速度要求。经过选用多个MPEG压缩视频进行实验分析证明,此方法能够精确有效地检测出视频流中存在的镜头边界。 展开更多
关键词 信息处理技术 视频分割 宏块类型 场景变换 帧图像组
下载PDF
一种高速切变镜头边界探测算法
18
作者 王伟强 高文 马继涌 《计算机科学》 CSCD 北大核心 2001年第7期56-59,45,共5页
1 引言目前,数字化信息已从过去的简单文本发展成含有视频、音频、图片、文本等信息类型的多媒体信息。在多媒体数据库中,视频媒体的有效管理需要对视频数据结构化的支持,以方便用户对视频数据快速访问。镜头分割是视频信息管理系统对... 1 引言目前,数字化信息已从过去的简单文本发展成含有视频、音频、图片、文本等信息类型的多媒体信息。在多媒体数据库中,视频媒体的有效管理需要对视频数据结构化的支持,以方便用户对视频数据快速访问。镜头分割是视频信息管理系统对视频数据结构化的一项基本功能。由于完全的手工标注是一项耗时枯燥的人力劳动。 展开更多
关键词 多媒体数据库 镜头边界探测算法 视频信息 多分辨率
下载PDF
从文字渊源物的角度对语段——记意文字类型学的探讨 被引量:1
19
作者 朱建军 《大理学院学报(综合版)》 CAS 2003年第4期38-44,共7页
本文从文字渊源物的角度对语段——记意文字的类型作了初步探讨,把语段——记意文字主要划分为图画类文字和符号类文字,其中图画类文字根据其发展阶段的不同又划分为图画和象形字。在这种分类的基础上,文章对这几种类型文字的特点和内... 本文从文字渊源物的角度对语段——记意文字的类型作了初步探讨,把语段——记意文字主要划分为图画类文字和符号类文字,其中图画类文字根据其发展阶段的不同又划分为图画和象形字。在这种分类的基础上,文章对这几种类型文字的特点和内容都作了分析,并且得出了一些具有理论价值的结论。 展开更多
关键词 文字类型 图画类文字 象形字 符号类文字 汉字 “语段-记意文字”
下载PDF
双路视频同步采集与实时处理技术
20
作者 邹志 唐建博 《光学与光电技术》 2009年第5期32-35,共4页
利用CCD的外同步工作特性,结合图像采集通道软件切换、多线程、事件驱动和图像压缩显示等技术,实现了双路视频的同步采集和实时显示与处理。在目标提取算法中,先采用带阻滤波隔离干扰,再采用自动阈值分割区分星点目标与背景,通过聚类分... 利用CCD的外同步工作特性,结合图像采集通道软件切换、多线程、事件驱动和图像压缩显示等技术,实现了双路视频的同步采集和实时显示与处理。在目标提取算法中,先采用带阻滤波隔离干扰,再采用自动阈值分割区分星点目标与背景,通过聚类分析剔除虚假目标干扰后,采用质心算法计算星点目标的质心坐标。经实验验证,该技术在单PC104的硬件基础上,既能稳定提取双路视频的星点目标,又成功满足了系统对双路视频同步采集、实时处理与显示的要求。 展开更多
关键词 实时处理 帧同步 聚类 自动阈值分割
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部