期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
Semantic segmentation via pixel-to-center similarity calculation
1
作者 Dongyue Wu Zilin Guo +3 位作者 Aoyan Li Changqian Yu Nong Sang Changxin Gao 《CAAI Transactions on Intelligence Technology》 SCIE EI 2024年第1期87-100,共14页
Since the fully convolutional network has achieved great success in semantic segmentation,lots of works have been proposed to extract discriminative pixel representations.However,the authors observe that existing meth... Since the fully convolutional network has achieved great success in semantic segmentation,lots of works have been proposed to extract discriminative pixel representations.However,the authors observe that existing methods still suffer from two typical challenges:(i)The intra-class feature variation between different scenes may be large,leading to the difficulty in maintaining the consistency between same-class pixels from different scenes;(ii)The inter-class feature distinction in the same scene could be small,resulting in the limited performance to distinguish different classes in each scene.The authors first rethink se-mantic segmentation from a perspective of similarity between pixels and class centers.Each weight vector of the segmentation head represents its corresponding semantic class in the whole dataset,which can be regarded as the embedding of the class center.Thus,the pixel-wise classification amounts to computing similarity in the final feature space between pixels and the class centers.Under this novel view,the authors propose a Class Center Similarity(CCS)layer to address the above-mentioned challenges by generating adaptive class centers conditioned on each scenes and supervising the similarities between class centers.The CCS layer utilises the Adaptive Class Center Module to generate class centers conditioned on each scene,which adapt the large intra-class variation between different scenes.Specially designed Class Distance Loss(CD Loss)is introduced to control both inter-class and intra-class distances based on the predicted center-to-center and pixel-to-center similarity.Finally,the CCS layer outputs the processed pixel-to-center similarity as the segmentation prediction.Extensive experiments demonstrate that our model performs favourably against the state-of-the-art methods. 展开更多
关键词 computer vision deep neural networks image segmentation scene understanding
下载PDF
Designing a High-Performance Deep Learning Theoretical Model for Biomedical Image Segmentation by Using Key Elements of the Latest U-Net-Based Architectures
2
作者 Andreea Roxana Luca Tudor Florin Ursuleanu +5 位作者 Liliana Gheorghe Roxana Grigorovici Stefan Iancu Maria Hlusneac Cristina Preda Alexandru Grigorovici 《Journal of Computer and Communications》 2021年第7期8-20,共13页
Deep learning (DL) has experienced an exponential development in recent years, with major impact in many medical fields, especially in the field of medical image and, respectively, as a specific task, in the segmentat... Deep learning (DL) has experienced an exponential development in recent years, with major impact in many medical fields, especially in the field of medical image and, respectively, as a specific task, in the segmentation of the medical image. We aim to create a computer assisted diagnostic method, optimized by the use of deep learning (DL) and validated by a randomized controlled clinical trial, is a highly automated tool for diagnosing and staging precancerous and cervical cancer and thyroid cancers. We aim to design a high-performance deep learning model, combined from convolutional neural network (U-Net)-based architectures, for segmentation of the medical image that is independent of the type of organs/tissues, dimensions or type of image (2D/3D) and to validate the DL model in a randomized, controlled clinical trial. We used as a methodology primarily the analysis of U-Net-based architectures to identify the key elements that we considered important in the design and optimization of the combined DL model, from the U-Net-based architectures, imagined by us. Secondly, we will validate the performance of the DL model through a randomized controlled clinical trial. The DL model designed by us will be a highly automated tool for diagnosing and staging precancers and cervical cancer and thyroid cancers. The combined model we designed takes into account the key features of each of the architectures Overcomplete Convolutional Network Kite-Net (Kite-Net), Attention gate mechanism is an improvement added on convolutional network architecture for fast and precise segmentation of images (Attention U-Net), Harmony Densely Connected Network-Medical image Segmentation (HarDNet-MSEG). In this regard, we will create a comprehensive computer assisted diagnostic methodology validated by a randomized controlled clinical trial. The model will be a highly automated tool for diagnosing and staging precancers and cervical cancer and thyroid cancers. This would help drastically minimize the time and effort that specialists put into analyzing medical images, help to achieve a better therapeutic plan, and can provide a “second opinion” of computer assisted diagnosis. 展开更多
关键词 Combined Model of U-Net-Based Architectures Medical image segmentation 2D/3D/CT/RMN images
下载PDF
A Method for 3D Scene Description and Segmentation in an Object Record
3
作者 Chen Tingbiao(Department of Radio Engineering,Naming University of Posts and Telecommunications,Naming 210003,P.R.China) 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 1996年第1期37-42,共6页
in this poper a novel data-and rule-driven system for 3D scene description and segmentation inan unknown environment is presented.This system generatss hierachies of features that correspond tostructural elements such... in this poper a novel data-and rule-driven system for 3D scene description and segmentation inan unknown environment is presented.This system generatss hierachies of features that correspond tostructural elements such as boundaries and shape classes of individual object as well as relationshipsbetween objects.It is implemented as an added high-level component to an existing low-level binocularvision system[1]. Based on a pair of matched stereo images produced by that system,3D segmentation is firstperformed to group object boundary data into several edge-sets,each of which is believed to belong to aparticular object.Then gross features of each object are extracted and stored in an object recbrd.The finalstructural description of the scene is accomplished with information in the object record,a set of rules and arule implementor. The System is designed to handle partially occluded objects of different shapes and sizeson the 2D imager.Experimental results have shown its success in computing both object and structurallevel descriptions of common man-made objects. 展开更多
关键词 s:image segmentation 3D scene description object record image understanding
原文传递
基于图像处理的轨旁组合信号灯识别方法 被引量:2
4
作者 郭齐成 沈拓 张轩雄 《电子科技》 2023年第7期8-15,共8页
对列车轨旁信号灯进行准确辨识是保障列车安全运行的重要措施。然而,对于轨道系统而言,除了通常的单色信号灯外,还有组合(两种颜色)信号灯的指示方式。针对轨旁组合信号灯的识别问题,文中提出了一种基于图像处理技术对位于列车前方150 ... 对列车轨旁信号灯进行准确辨识是保障列车安全运行的重要措施。然而,对于轨道系统而言,除了通常的单色信号灯外,还有组合(两种颜色)信号灯的指示方式。针对轨旁组合信号灯的识别问题,文中提出了一种基于图像处理技术对位于列车前方150 m内的轨旁组合信号灯的识别方法。根据组合信号灯的颜色和形状特征,采用颜色分割、形态学处理、霍夫变换等手段提取组合信号灯的候选区域。同时利用组合信号灯位于当前轨道右侧的位置特征以及组合信号灯之间圆心距的距离特征,定位其位置并识别组合灯颜色。实验结果表明,该方法能准确定位和识别轨旁组合信号灯,对绿与黄、两绿和两黄这3种组合灯的识别率分别为94.14%、96.21%、86.67%。 展开更多
关键词 轨旁组合信号灯 图像处理 颜色分割 形态学操作 霍夫变换 边缘检测 轨道提取 图像识别
下载PDF
基于伪标签自细化的弱监督实例分割
5
作者 吴仕科 梁宇琦 《计算机应用研究》 CSCD 北大核心 2023年第6期1882-1887,共6页
大多数弱监督实例分割方法利用类激活图生成的伪标签以及多阶段的训练策略,在实例分割上取得了不错的性能,但这些方法在检出物体完整性上仍然面临许多挑战。针对上述问题,提出了一种基于伪标签自细化的弱监督实例分割方法(pseudo-label ... 大多数弱监督实例分割方法利用类激活图生成的伪标签以及多阶段的训练策略,在实例分割上取得了不错的性能,但这些方法在检出物体完整性上仍然面临许多挑战。针对上述问题,提出了一种基于伪标签自细化的弱监督实例分割方法(pseudo-label self-refinement,PLSR),即在训练过程不断地利用网络自身的结果筛选、聚合候选区域得到各分支的伪标签,保障并逐步提升伪标签的质量,最终提高实例分割的性能。在Pascal VOC2012和MS-COCO数据集上进行实验,与现有的弱监督实例分割方法进行对比,AP50分别提高了1.6%和1.9%。实验结果表明,伪标签自细化方法能够有效利用候选区域的形状信息以及网络自身的语义信息提升伪标签的质量并取得了良好的分割效果,最终提高了弱监督实例分割的性能。 展开更多
关键词 实例分割 弱监督学习 图像级别标注 视觉理解
下载PDF
基于多尺度上下文的图像标注算法 被引量:6
6
作者 周全 王磊 +1 位作者 周亮 郑宝玉 《自动化学报》 EI CSCD 北大核心 2014年第12期2944-2949,共6页
提出了一种在层次化分割框架下,通过结合图像的底层局部特征以及高层的上下文特征,进行图像自动语义标注的新算法.该算法的核心思想在于对较大的图像区域的识别结果有利于对其包含的较小图像区域进行识别.算法首先对每层分割后的图像区... 提出了一种在层次化分割框架下,通过结合图像的底层局部特征以及高层的上下文特征,进行图像自动语义标注的新算法.该算法的核心思想在于对较大的图像区域的识别结果有利于对其包含的较小图像区域进行识别.算法首先对每层分割后的图像区域进行识别,然后利用贝叶斯定理将各层区域识别的结果通过线性加权的方式进行融合,从而达到对整幅图像进行自动语义标注的目的.与现有的图像标注算法相比,仿真实验表明本文算法获得了最好的标注精度以及最快的标注速度. 展开更多
关键词 图像标注与理解 图像分割 特征选择 分类
下载PDF
视频图像理解的一般性框架研究 被引量:4
7
作者 梁英宏 王知衍 +1 位作者 曹晓叶 许晓伟 《计算机应用研究》 CSCD 北大核心 2008年第7期2203-2207,共5页
视频图像理解侧重于对视频序列进行解释,既涉及到图像的空间特性,也涉及到视频序列的时间特性,是目前计算机视觉领域的一个研究热点。回顾了视频图像理解方法的研究现状,提出视频图像理解的一般性框架,包括层次结构、涉及的技术领域和... 视频图像理解侧重于对视频序列进行解释,既涉及到图像的空间特性,也涉及到视频序列的时间特性,是目前计算机视觉领域的一个研究热点。回顾了视频图像理解方法的研究现状,提出视频图像理解的一般性框架,包括层次结构、涉及的技术领域和应用的系统结构,并以一个实际应用作为示例解释该框架的层次结构。 展开更多
关键词 视频图像理解 视频图像分割 目标识别 行为理解 场景理解
下载PDF
视频图像理解在客流统计中的应用 被引量:8
8
作者 梁英宏 王知衍 +1 位作者 曹晓叶 许晓伟 《计算机工程与设计》 CSCD 北大核心 2008年第5期1203-1206,共4页
视频图像理解侧重于对时间序列进行分析,既涉及到图像的空间特性,也涉及到视频序列的时间特性,是目前计算机视觉领域的一个研究热点,而客流统计是视频图像理解的一个重要应用。提出了视频图像理解的层次结构,即视频图像分割、目标识别... 视频图像理解侧重于对时间序列进行分析,既涉及到图像的空间特性,也涉及到视频序列的时间特性,是目前计算机视觉领域的一个研究热点,而客流统计是视频图像理解的一个重要应用。提出了视频图像理解的层次结构,即视频图像分割、目标识别、场景和行为理解,同时对每个层次的操作对象、任务和技术领域进行描述,然后总结了客流统计方法的一些研究成果,将客流统计分成行人计数和人群密度估计两种问题,并利用该层次结构解决这个实际应用。 展开更多
关键词 客流统计 视频图像理解 视频图像分割 行人计数 人群密度估计
下载PDF
基于机器视觉的谷物联合收获机行走目标直线检测 被引量:10
9
作者 吴刚 谭彧 +1 位作者 郑永军 王书茂 《农业机械学报》 EI CAS CSCD 北大核心 2012年第S1期266-270,共5页
针对谷物联合收获机视觉导航,提出基于改进Hough变换(HT)的谷物联合收获机行走目标直线检测算法。通过改进一维最大熵阈值分割方法,提高了阈值分割的速度;对二值图像通过行扫描和列扫描,确定了行走目标直线的终点位置以及直线方向上的... 针对谷物联合收获机视觉导航,提出基于改进Hough变换(HT)的谷物联合收获机行走目标直线检测算法。通过改进一维最大熵阈值分割方法,提高了阈值分割的速度;对二值图像通过行扫描和列扫描,确定了行走目标直线的终点位置以及直线方向上的候选点;以候选点为点集,利用最小二乘直线拟合和直线终点位置确定了待检测直线上已知一点;利用改进HT完成直线检测,与传统的HT相比,将二元映射转换为一元映射,加快了算法速度、减少了空间占用和提高了抗干扰能力。经过对多幅图片的处理,证明算法能够有效地检测出直线参数,且处理时间在100 ms左右。 展开更多
关键词 联合收获机 机器视觉 HOUGH变换 直线检测 图像分割
下载PDF
电视图像目标实时分割与识别算法 被引量:5
10
作者 苗常青 汪渤 +1 位作者 付梦印 徐学强 《北京理工大学学报》 EI CAS CSCD 北大核心 2005年第9期786-790,共5页
研究一种电视图像目标实时分割和识别算法.在二维图像不变矩和相对矩的基础上,进一步组合优化得出4个不变矩,结合复数矩、圆方差和椭圆方差组成目标特征向量,利用k-近邻法实现目标的识别和分类.图像分割采用改进矩不变阈值分割和基于梯... 研究一种电视图像目标实时分割和识别算法.在二维图像不变矩和相对矩的基础上,进一步组合优化得出4个不变矩,结合复数矩、圆方差和椭圆方差组成目标特征向量,利用k-近邻法实现目标的识别和分类.图像分割采用改进矩不变阈值分割和基于梯度的自适应阈值分割提取目标.仿真实验表明,提取的目标特征量对于平移、缩放和旋转均能保持较好的不变性.用该分割算法分割的图像边缘清晰,分割时间为8 m s,易于硬件实现. 展开更多
关键词 图像分割 特征提取 目标识别 组合不变矩
下载PDF
图像理解 被引量:4
11
作者 张会章 张利霞 郭雷 《计算机工程》 CAS CSCD 北大核心 2003年第11期23-24,71,共3页
图像理解是从图像中自动提取信息的一门科学,该学科的基本技术包括图像组成 模型化、图像建立和数据可视化。对于开发基于输入图像解释来做出决策的人工智能系统来 说图像理解是一个重要环节。该文就知识在航空图像理解系统中的作用进... 图像理解是从图像中自动提取信息的一门科学,该学科的基本技术包括图像组成 模型化、图像建立和数据可视化。对于开发基于输入图像解释来做出决策的人工智能系统来 说图像理解是一个重要环节。该文就知识在航空图像理解系统中的作用进行了探讨,主要介 绍了自动理解中的知识表示和控制结构,并通过一个机场的例子,说明图像解释中通用知识 的应用,进一步强调图像理解中知识运用的重要性。 展开更多
关键词 图像理解 图像分析 知识表示 语义网络 控制方法 分割 图像解释
下载PDF
SAR图像理解与解译研究进展 被引量:6
12
作者 焦李成 王爽 侯彪 《电子学报》 EI CAS CSCD 北大核心 2005年第B12期2423-2434,共12页
本文主要评述SAR图像理解与解译的研究现状,并指出了该领域的相关问题及今后的发展趋势.论文从SAR图像相干斑抑制、图像分割、特征提取、识别与分类等六个方面较深入地分析了SAR图像理解与解译关键技术的最新进展,指出了进一步研究... 本文主要评述SAR图像理解与解译的研究现状,并指出了该领域的相关问题及今后的发展趋势.论文从SAR图像相干斑抑制、图像分割、特征提取、识别与分类等六个方面较深入地分析了SAR图像理解与解译关键技术的最新进展,指出了进一步研究的方向. 展开更多
关键词 SAR图像 图像理解与解译 相干斑点抑制 特征抽取 图像分割 机器学习 多尺度几何分析
下载PDF
基于车牌字符笔画特征的快速定位算法 被引量:5
13
作者 管庶安 廖明潮 万常芹 《计算机工程与应用》 CSCD 北大核心 2005年第12期186-188,共3页
针对车辆图像分割困难,车牌位置定位不准等问题,提出了一种新的车牌快速定位算法。该算法通过对车牌一维字符笔画特征搜索,能够快速地定位车牌。试验表明该算法定位速度快、准确定位率高。
关键词 车牌定位 二值化 图像分割
下载PDF
基于遥感多特征组合的冰川及其相关地表类型信息提取 被引量:9
14
作者 龚剑明 杨晓梅 +2 位作者 张涛 何亚文 李秦 《地球信息科学》 CSCD 北大核心 2009年第6期765-772,共8页
冰川作为青藏高原的一种典型的地表覆盖类型,在高寒地区广泛分布,往往因为地形复杂,无法实地测绘。本文利用高分辨率遥感影像和高精度的DEM,在分析各种冰川类别的光谱、形状、空间关系、地形和气候等环境分布特征的基础上,综合和发展了... 冰川作为青藏高原的一种典型的地表覆盖类型,在高寒地区广泛分布,往往因为地形复杂,无法实地测绘。本文利用高分辨率遥感影像和高精度的DEM,在分析各种冰川类别的光谱、形状、空间关系、地形和气候等环境分布特征的基础上,综合和发展了现有的特征描述算法,建立了描述各种冰川类别特征的组合提取模型,运用面向对象的自动提取方法,对西部测图区青藏高原试验区进行了冰雪影像自动识别试验。试验结果表明,该方法是可行的,它对难以实地测量的冰雪信息引进了遥感自动提取方法,为研究冰川消融和气候变化拓展了研究思路。 展开更多
关键词 多特征组合模型 多尺度影像分割 信息提取
下载PDF
相机运动条件下的视频前景提取 被引量:2
15
作者 陈成 庄越挺 肖俊 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第6期973-977,982,共6页
提出一种基于非参数化运动估计和图像配准的方法来进行相机运动条件下的前景提取.通过对视频帧和接近的训练背景图像进行非参数化运动估计,动态地构造出一幅和视频帧的视角完全相同的背景图像,再通过背景减除提取前景.为了解决运动估计... 提出一种基于非参数化运动估计和图像配准的方法来进行相机运动条件下的前景提取.通过对视频帧和接近的训练背景图像进行非参数化运动估计,动态地构造出一幅和视频帧的视角完全相同的背景图像,再通过背景减除提取前景.为了解决运动估计的计算效率问题,又提出一种基于流形的改进算法:在离线阶段,预先对训练背景图像进行非参数化运动估计,并利用流形学习对训练背景图像进行建模;在在线阶段,通过在背景流形上进行运动插值来快速地估计新视频帧和训练背景图像之间的运动.实验表明,改进的方法在基本保持像素提取准确率的同时获得了很高的效率. 展开更多
关键词 前景提取 背景图像 背景减除 视频理解
下载PDF
基于多神经网络分类器组合的火焰图像分割 被引量:3
16
作者 李树涛 王耀南 毛建旭 《数据采集与处理》 CSCD 2000年第4期443-446,共4页
单一神经网络分类器的性能很大程度上取决于网络参数的选择 ,设计一个性能最优的神经网络分类器是非常困难的。针对这一问题 ,本文提出了基于多个 BP神经网络分类器组合的回转窑火焰图像分割方法。选取多组不同的训练样本对多个具有不... 单一神经网络分类器的性能很大程度上取决于网络参数的选择 ,设计一个性能最优的神经网络分类器是非常困难的。针对这一问题 ,本文提出了基于多个 BP神经网络分类器组合的回转窑火焰图像分割方法。选取多组不同的训练样本对多个具有不同初始条件的 BP网络进行训练 ,网络收敛后 ,用于火焰图像的分割 ,会产生多种分割结果 ,采用平均值法、投票表决法、最大统计概率法和神经网络 4种方法对其进行组合 ,得到了最终的分割结果。实验结果表明 ,本文提出的方法具有分割效果好和可靠性高等优点 ,满足了实际使用的要求。 展开更多
关键词 BP神经网络 分类器组合 图像分割 回转窑
下载PDF
图像理解原理的数学评价 被引量:2
17
作者 张克军 刘哲 《计算机工程与设计》 CSCD 北大核心 2007年第8期1876-1878,1905,共4页
图像是一种客观存在的事物,它以不同的模式向人们传递信息。图像理解就是模式分析和理解,是一门研究用计算机系统分析和理解图像,实现类似人类视觉系统理解外部世界的学科。介绍了图像理解的基本概念、原理以及与相关学科的联系和区别,... 图像是一种客观存在的事物,它以不同的模式向人们传递信息。图像理解就是模式分析和理解,是一门研究用计算机系统分析和理解图像,实现类似人类视觉系统理解外部世界的学科。介绍了图像理解的基本概念、原理以及与相关学科的联系和区别,综合分析总结了目前在图像恢复、图像分割及特征提取中常见的多种算法的特点,并且对图像理解的应用发展进行了一定的展望。 展开更多
关键词 图像 图像理解 图像恢复 图像分割 特征提取
下载PDF
基于Snake和外观模板的组合式图像对象分割 被引量:2
18
作者 林克正 李慧 李新元 《计算机应用研究》 CSCD 北大核心 2016年第3期927-929,944,共4页
针对目前图像对象分割方法对图像的特征提取和抽象度不够,导致分割精度低的问题,提出了基于Snake模型和外观模板的组合式图像对象分割研究方法。该方法将改进的外观模板图像对象分割算法得到的分割结果经过预处理作为改进的Snake模型的... 针对目前图像对象分割方法对图像的特征提取和抽象度不够,导致分割精度低的问题,提出了基于Snake模型和外观模板的组合式图像对象分割研究方法。该方法将改进的外观模板图像对象分割算法得到的分割结果经过预处理作为改进的Snake模型的图像分割算法的输入初始轮廓进行精确处理。该算法在提升对象分割精度的有效性上达到了96%以上。 展开更多
关键词 组合式图像对象分割 Snake模型算法 外观模板图像分割 GVF场 纹理分析
下载PDF
白细胞图像的柔性组合分割算法 被引量:4
19
作者 顾广华 崔冬 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第9期1977-1981,共5页
根据细胞图像的饱和度分量S和绿分量G中白细胞核分布的特点,构造组合加权图像,柔性调节权系数,提取细胞核,实现白细胞的初步定位。针对图像中红、白细胞的粘连现象,利用细胞图像红分量R和蓝分量B的分布,构造组合图像,提取白细胞。本文... 根据细胞图像的饱和度分量S和绿分量G中白细胞核分布的特点,构造组合加权图像,柔性调节权系数,提取细胞核,实现白细胞的初步定位。针对图像中红、白细胞的粘连现象,利用细胞图像红分量R和蓝分量B的分布,构造组合图像,提取白细胞。本文提出的柔性组合分割算法简单,计算量小,具有很好的分割效果,且分量权系数可自动调节,具有普适性。 展开更多
关键词 白细胞图像 柔性组合 细胞分割 细胞粘连
下载PDF
基于融合细分的纹理图像重构模型 被引量:4
20
作者 万金梁 王健 《计算机应用》 CSCD 北大核心 2015年第11期3194-3197,3202,共5页
针对分段迭代曲线拟合存在的重建区域轮廓不连续、重建区域尺寸有误差等问题,提出了一种基于融合细分的纹理图像重构模型。首先提取原始图像的分割区域,经过轮廓跟踪与下采样得到区域形状的特征向量;然后利用三重逼近与三重插值统一的... 针对分段迭代曲线拟合存在的重建区域轮廓不连续、重建区域尺寸有误差等问题,提出了一种基于融合细分的纹理图像重构模型。首先提取原始图像的分割区域,经过轮廓跟踪与下采样得到区域形状的特征向量;然后利用三重逼近与三重插值统一的融合细分方法,重建区域轮廓曲线;最后合成区域纹理,得到纹理图像重构结果。在多幅自然场景图像上进行实验验证,并给出相应的实验结果和分析。实验结果表明,所提模型正确有效,具有和人类视觉特性相符合的重构结果;所提算法能够减少图像重建时的处理时间,并在图像质量主观评价指标上明显优于多区域图像重建算法。 展开更多
关键词 纹理图像重构 图像分割 融合细分 纹理合成
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部