期刊文献+
共找到565篇文章
< 1 2 29 >
每页显示 20 50 100
Information Hiding Method Based on Block DWT Sub-Band Feature Encoding
1
作者 Qiudong SUN Wenxin MA +1 位作者 Wenying YAN Hong DAI 《Journal of Software Engineering and Applications》 2009年第5期383-387,共5页
For realizing of long text information hiding and covert communication, a binary watermark sequence was obtained firstly from a text file and encoded by a redundant encoding method. Then, two neighboring blocks were s... For realizing of long text information hiding and covert communication, a binary watermark sequence was obtained firstly from a text file and encoded by a redundant encoding method. Then, two neighboring blocks were selected at each time from the Hilbert scanning sequence of carrier image blocks, and transformed by 1-level discrete wavelet transformation (DWT). And then the double block based JNDs (just noticeable difference) were calculated with a visual model. According to the different codes of each two watermark bits, the average values of two corresponding detail sub-bands were modified by using one of JNDs to hide information into carrier image. The experimental results show that the hidden information is invisible to human eyes, and the algorithm is robust to some common image processing operations. The conclusion is that the algorithm is effective and practical. 展开更多
关键词 sub-band feature encoding REDUNDANT encoding Visual Model Discrete WAVELET Transformation Information Hiding
下载PDF
A Lightweight Network with Dual Encoder and Cross Feature Fusion for Cement Pavement Crack Detection
2
作者 Zhong Qu Guoqing Mu Bin Yuan 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第7期255-273,共19页
Automatic crack detection of cement pavement chiefly benefits from the rapid development of deep learning,with convolutional neural networks(CNN)playing an important role in this field.However,as the performance of cr... Automatic crack detection of cement pavement chiefly benefits from the rapid development of deep learning,with convolutional neural networks(CNN)playing an important role in this field.However,as the performance of crack detection in cement pavement improves,the depth and width of the network structure are significantly increased,which necessitates more computing power and storage space.This limitation hampers the practical implementation of crack detection models on various platforms,particularly portable devices like small mobile devices.To solve these problems,we propose a dual-encoder-based network architecture that focuses on extracting more comprehensive fracture feature information and combines cross-fusion modules and coordinated attention mechanisms formore efficient feature fusion.Firstly,we use small channel convolution to construct shallow feature extractionmodule(SFEM)to extract low-level feature information of cracks in cement pavement images,in order to obtainmore information about cracks in the shallowfeatures of images.In addition,we construct large kernel atrous convolution(LKAC)to enhance crack information,which incorporates coordination attention mechanism for non-crack information filtering,and large kernel atrous convolution with different cores,using different receptive fields to extract more detailed edge and context information.Finally,the three-stage feature map outputs from the shallow feature extraction module is cross-fused with the two-stage feature map outputs from the large kernel atrous convolution module,and the shallow feature and detailed edge feature are fully fused to obtain the final crack prediction map.We evaluate our method on three public crack datasets:DeepCrack,CFD,and Crack500.Experimental results on theDeepCrack dataset demonstrate the effectiveness of our proposed method compared to state-of-the-art crack detection methods,which achieves Precision(P)87.2%,Recall(R)87.7%,and F-score(F1)87.4%.Thanks to our lightweight crack detectionmodel,the parameter count of the model in real-world detection scenarios has been significantly reduced to less than 2M.This advancement also facilitates technical support for portable scene detection. 展开更多
关键词 Shallow feature extraction module large kernel atrous convolution dual encoder lightweight network crack detection
下载PDF
Feature Enhanced Stacked Auto Encoder for Diseases Detection in Brain MRI
3
作者 Umair Muneer Butt Rimsha Arif +2 位作者 Sukumar Letchmunan Babur Hayat Malik Muhammad Adil Butt 《Computers, Materials & Continua》 SCIE EI 2023年第8期2551-2570,共20页
The detection of brain disease is an essential issue in medical and research areas.Deep learning techniques have shown promising results in detecting and diagnosing brain diseases using magnetic resonance imaging(MRI)... The detection of brain disease is an essential issue in medical and research areas.Deep learning techniques have shown promising results in detecting and diagnosing brain diseases using magnetic resonance imaging(MRI)images.These techniques involve training neural networks on large datasets of MRI images,allowing the networks to learn patterns and features indicative of different brain diseases.However,several challenges and limitations still need to be addressed further to improve the accuracy and effectiveness of these techniques.This paper implements a Feature Enhanced Stacked Auto Encoder(FESAE)model to detect brain diseases.The standard stack auto encoder’s results are trivial and not robust enough to boost the system’s accuracy.Therefore,the standard Stack Auto Encoder(SAE)is replaced with a Stacked Feature Enhanced Auto Encoder with a feature enhancement function to efficiently and effectively get non-trivial features with less activation energy froman image.The proposed model consists of four stages.First,pre-processing is performed to remove noise,and the greyscale image is converted to Red,Green,and Blue(RGB)to enhance feature details for discriminative feature extraction.Second,feature Extraction is performed to extract significant features for classification using DiscreteWavelet Transform(DWT)and Channelization.Third,classification is performed to classify MRI images into four major classes:Normal,Tumor,Brain Stroke,and Alzheimer’s.Finally,the FESAE model outperforms the state-of-theart,machine learning,and deep learning methods such as Artificial Neural Network(ANN),SAE,Random Forest(RF),and Logistic Regression(LR)by achieving a high accuracy of 98.61% on a dataset of 2000 MRI images.The proposed model has significant potential for assisting radiologists in diagnosing brain diseases more accurately and improving patient outcomes. 展开更多
关键词 Brain diseases deep learning feature enhanced stacked auto encoder stack auto encoder
下载PDF
Improve Fractal Compression Encoding Speed Using Feature Extraction and Self-organization Network 被引量:1
4
作者 Berthe Kya, Yang Yang Information Engineering School. University of Science and Technology Beijing. Beijing 100083. China 《Journal of University of Science and Technology Beijing》 CSCD 2001年第4期306-310,共5页
Image compression consists of two main parts: encoding and decoding. One of the important problems of the fractal theory is the long encoding implementation time, which hindered the acceptance of fractal image compres... Image compression consists of two main parts: encoding and decoding. One of the important problems of the fractal theory is the long encoding implementation time, which hindered the acceptance of fractal image compression as a practical method. The long encoding time results from the need to perform a large number of domain-range matches, the total encoding time is the product of the number of matches and the time to perform each match. In order to improve encoding speed, a hybrid method combining features extraction and self-organization network has been provided, which is based on the feature extraction approach the comparison pixels by pixels between the feature of range blocks and domains blocks. The efficiency of the new method was been proved by examples. 展开更多
关键词 image compression fractal theory features extraction self-organization network fractal encoding
下载PDF
Prediction of Pediatric Sepsis Using a Deep Encoding Network with Cross Features
5
作者 陈潇 张瑞 +1 位作者 汤心溢 钱娟 《Journal of Shanghai Jiaotong university(Science)》 EI 2024年第1期131-140,共10页
Sepsis poses a serious threat to health of children in pediatric intensive care unit.The mortality from pediatric sepsis can be effectively reduced through in-time diagnosis and therapeutic intervention.The bacillicul... Sepsis poses a serious threat to health of children in pediatric intensive care unit.The mortality from pediatric sepsis can be effectively reduced through in-time diagnosis and therapeutic intervention.The bacilliculture detection method is too time-consuming to receive timely treatment.In this research,we propose a new framework:a deep encoding network with cross features(CF-DEN)that enables accurate early detection of sepsis.Cross features are automatically constructed via the gradient boosting decision tree and distilled into the deep encoding network(DEN)we designed.The DEN is aimed at learning sufficiently effective representation from clinical test data.Each layer of the DEN fltrates the features involved in computation at current layer via attention mechanism and outputs the current prediction which is additive layer by layer to obtain the embedding feature at last layer.The framework takes the advantage of tree-based method and neural network method to extract effective representation from small clinical dataset and obtain accurate prediction in order to prompt patient to get timely treatment.We evaluate the performance of the framework on the dataset collected from Shanghai Children's Medical Center.Compared with common machine learning methods,our method achieves the increase on F1-score by 16.06%on the test set. 展开更多
关键词 pediatric sepsis gradient boosting decision tree cross feature neural network deep encoding network with cross features(CF-DEN)
原文传递
EFFECTIVE FEATURE ANALYSIS FOR COLOR IMAGE SEGMENTATION 被引量:2
6
作者 黎宁 毛四新 李有福 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2001年第2期206-212,共7页
An approach for color image segmentation is proposed based on the contributions of color features to segmentation rather than the choice of a particular color space. The determination of effective color features depen... An approach for color image segmentation is proposed based on the contributions of color features to segmentation rather than the choice of a particular color space. The determination of effective color features depends on the analysis of various color features from each tested color image via the designed feature encoding. It is different from the pervious methods where self organized feature map (SOFM) is used for constructing the feature encoding so that the feature encoding can self organize the effective features for different color images. Fuzzy clustering is applied for the final segmentation when the well suited color features and the initial parameter are available. The proposed method has been applied in segmenting different types of color images and the experimental results show that it outperforms the classical clustering method. The study shows that the feature encoding approach offers great promise in automating and optimizing the segmentation of color images. 展开更多
关键词 image segmentation color image neural networks fuzzy clustering feature encoding
下载PDF
基于时空特征融合的Encoder-Decoder多步4D短期航迹预测
7
作者 石庆研 张泽中 韩萍 《信号处理》 CSCD 北大核心 2023年第11期2037-2048,共12页
航迹预测在确保空中交通安全、高效运行中扮演着至关重要的角色。所预测的航迹信息是航迹优化、冲突告警等决策工具的输入,而预测准确性取决于模型对航迹序列特征的提取能力。航迹序列数据是具有丰富时空特征的多维时间序列,其中每个变... 航迹预测在确保空中交通安全、高效运行中扮演着至关重要的角色。所预测的航迹信息是航迹优化、冲突告警等决策工具的输入,而预测准确性取决于模型对航迹序列特征的提取能力。航迹序列数据是具有丰富时空特征的多维时间序列,其中每个变量都呈现出长短期的时间变化模式,并且这些变量之间还存在着相互依赖的空间信息。为了充分提取这种时空特征,本文提出了基于融合时空特征的编码器-解码器(Spatio-Temporal EncoderDecoder,STED)航迹预测模型。在Encoder中使用门控循环单元(Gated Recurrent Unit,GRU)、卷积神经网络(Convolutional Neural Network,CNN)和注意力机制(Attention,AT)构成的双通道网络来分别提取航迹时空特征,Decoder对时空特征进行拼接融合,并利用GRU对融合特征进行学习和递归输出,实现对未来多步航迹信息的预测。利用真实的航迹数据对算法性能进行验证,实验结果表明,所提STED网络模型能够在未来10 min预测范围内进行高精度的短期航迹预测,相比于LSTM、CNN-LSTM和AT-LSTM等数据驱动航迹预测模型具有更高的精度。此外,STED网络模型预测一个航迹点平均耗时为0.002 s,具有良好的实时性。 展开更多
关键词 4D航迹预测 时空特征 encoder-Decoder 门控循环单元
下载PDF
Anti-noise sound recognition based on energy-frequency feature
8
作者 ZHOU Xiaomin LI Ying 《智能系统学报》 CSCD 北大核心 2015年第5期810-819,共10页
In the natural environment,non-stationary background noise affects the animal sound recognition directly.Given this problem,a new technology of animal sound recognition based on energy-frequency(E-F)feature is propose... In the natural environment,non-stationary background noise affects the animal sound recognition directly.Given this problem,a new technology of animal sound recognition based on energy-frequency(E-F)feature is proposed in this paper.The animal sound is turned into spectrogram to show the energy,time and frequency characteristics.The sub-band frequency division and sub-band energy division are carried out on the spectrogram for extracting the statistical characteristic of energy and frequency,so as to achieve sub-band power distribution(SPD)and sub-band division.Radon transform(RT)and discrete wavelet transform(DWT)are employed to obtain the important projection coefficients,and the energy values of sub-band frequencies are calculated to extract the sub-band frequency feature.The E-F feature is formed by combining the SPD feature and sub-band energy value feature.The classification is achieved by support vector machine(SVM)classifier.The experimental results show that the method can achieve better recognition effect even when the SNR is below10 dB. 展开更多
关键词 animal sound recognition sub-band power distribution(SPD) sub-band FREQUENCY feature RADON transform(RT) energy-frequency(E-F)feature
下载PDF
基于改进VGG16的自编码器视频异常检测算法 被引量:1
9
作者 杨大为 刘志权 《计算机技术与发展》 2024年第4期95-100,共6页
在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像... 在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像素级相似性,对于复杂场景,像素级相似性可能无法准确判断预测帧与真实帧之间的相似性。针对以上问题,对基于U-Net风格的自编码器进行改进,提出了一种使用改进的VGG16作为编码器的视频异常检测算法,同时在均方误差的基础上添加结构相似性(SSIM)损失函数。改进的VGG16去掉了全连接层,并加入了残差连接防止特征退化,添加SSIM在计算像素级相似性的同时计算图像的亮度、对比度和结构等方面的相似性来优化网络。实验结果表明,改进后的算法,在Ped2数据集上检测效果达到95.91%,在Avenue数据集上检测效果达到84.89%,与改进前的方法相比分别提高了0.80%和0.19%,验证了所提方法的有效性。 展开更多
关键词 自编码器 U-Net 特征提取 VGG16 残差连接 结构相似性
下载PDF
MCM-ICE:联合独立编码和协同编码的多模态分类模型
10
作者 郭锐锋 魏靖烜 +1 位作者 于碧辉 孙林壮 《小型微型计算机系统》 CSCD 北大核心 2024年第9期2080-2086,共7页
多模态数据处理是一个重要的研究领域,它可以通过结合文本、图像等多种信息来提高模型性能.然而,由于不同模态之间的异构性以及信息融合的挑战,设计有效的多模态分类模型仍然是一个具有挑战性的问题.本文提出了一种新的多模态分类模型—... 多模态数据处理是一个重要的研究领域,它可以通过结合文本、图像等多种信息来提高模型性能.然而,由于不同模态之间的异构性以及信息融合的挑战,设计有效的多模态分类模型仍然是一个具有挑战性的问题.本文提出了一种新的多模态分类模型——MCM-ICE,它通过联合独立编码和协同编码策略来解决特征表示和特征融合的挑战.MCM-ICE在Fashion-Gen和Hateful Memes Challenge两个数据集上进行了实验,结果表明该模型在这两项任务中均优于现有的最先进方法.本文还探究了协同编码模块Transformer输出层的不同向量选取对结果的影响,结果表明选取[CLS]向量和去除[CLS]的向量的平均池化向量可以获得最佳结果.消融研究和探索性分析支持了MCM-ICE模型在处理多模态分类任务方面的有效性. 展开更多
关键词 多模态数据处理 特征表示 特征融合 协同编码
下载PDF
基于门控位置编码的壁画图像多级色彩还原
11
作者 徐志刚 张创 《计算机应用》 CSCD 北大核心 2024年第9期2931-2937,共7页
近年来,壁画图像的色彩还原研究已成为壁画文物保护和展示领域的一个热点问题。针对壁画色彩还原面临的整体特征信息难以有效提取和保持,局部色彩还原易出现假色以及色彩溢出等问题,提出基于门控位置编码的壁画图像多级色彩还原方法。首... 近年来,壁画图像的色彩还原研究已成为壁画文物保护和展示领域的一个热点问题。针对壁画色彩还原面临的整体特征信息难以有效提取和保持,局部色彩还原易出现假色以及色彩溢出等问题,提出基于门控位置编码的壁画图像多级色彩还原方法。首先,构建基于全局特征约束的编码器网络,并通过改进的多核多值池化算法提取图像的全局特征梯度作为下采样取值标准以建立壁画图像特征金字塔,从而减少壁画图像在特征编码过程中的整体特征损失;其次,为准确还原壁画图像的局部色彩信息,设计基于门控位置编码的色彩迁移模块,该模块通过约束空间域中内容特征与色彩特征之间相似性核的学习,构建色彩特征在待还原壁画图像中的准确映射,从而减少还原图像中的假色现象与色彩溢出。实验结果表明,该方法所生成的壁画还原图像相较于AdaIN(Adaptive Instance Normalization)、AST(ArbitraryStyleTransfer)等对比方法所生成的壁画还原图像,NIQE(NaturalImageQuality Evaluator)和PIQE(Perception based Image Quality Evaluator)都取得了最优的结果。可见,所提方法能有效还原壁画色彩信息并保持待还原壁画图像的整体结构纹理特征。 展开更多
关键词 编码器-解码器网络 壁画图像 色彩还原 全局特征 位置编码
下载PDF
基于ECSDNN的航空安全事件风险等级预测
12
作者 冯霞 桑潇 左海超 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第4期1117-1128,共12页
航空安全事件风险等级预测是主动风险管理的重要手段。考虑海量航空安全事件数据呈现的高维复杂、类不平衡等特性,提出一种基于集成代价敏感深度神经网络(ECSDNN)的航空安全事件风险等级预测方法。采用分类型属性嵌入特征编码和数值型... 航空安全事件风险等级预测是主动风险管理的重要手段。考虑海量航空安全事件数据呈现的高维复杂、类不平衡等特性,提出一种基于集成代价敏感深度神经网络(ECSDNN)的航空安全事件风险等级预测方法。采用分类型属性嵌入特征编码和数值型属性拼接的方法实现航空安全事件数据的特征表示;综合考虑错分比例和固定代价设计代价敏感矩阵和代价敏感损失函数,构建基于代价敏感深度神经网络(CSDNN)的基分类器模型;采用硬投票方法,集成多个参数不同、性能各异的基分类器,构建航空安全事件风险等级预测模型。在航空安全事件报告系统(ASRS)数据集上的实验结果表明:相比基准算法,所提ECSDNN模型的预测准确率提升了4.51%;相比单个CSDNN基分类器,所提ECSDNN模型的预测准确率提升了3.17%。验证了基于ECSDNN的航空安全事件风险等级预测方法的有效性。 展开更多
关键词 航空安全 风险等级预测 嵌入特征编码 代价敏感 深度神经网络 集成学习
下载PDF
MFFNet:多级特征融合图像语义分割网络
13
作者 王燕 南佩奇 《计算机科学与探索》 CSCD 北大核心 2024年第3期707-717,共11页
在图像语义分割任务中,大多数方法未将不同尺度、不同层次的特征充分利用就直接进行上采样,会造成一些有效信息被当成冗余信息而被摒弃,从而降低对某些细小类别和相似类别分割的准确性和敏感性。为此,提出一个多级特征融合网络(MFFNet)... 在图像语义分割任务中,大多数方法未将不同尺度、不同层次的特征充分利用就直接进行上采样,会造成一些有效信息被当成冗余信息而被摒弃,从而降低对某些细小类别和相似类别分割的准确性和敏感性。为此,提出一个多级特征融合网络(MFFNet)。MFFNet采用编码器-解码器结构,在编码阶段,通过上下文信息提取路径和空间信息提取路径分别获取上下文信息与空间细节信息,增强像素间关联性与边界准确性;解码阶段设计一条多级特征融合路径,利用混合双边融合模块融合上下文信息;利用高低特征融合模块融合深层信息与空间信息;利用全局通道融合模块获取不同通道之间的联系,实现不同尺度信息的全局融合。MFFNet网络在PASCAL VOC 2012和Cityscapes验证集上的平均交互比(MIoU)分别为80.70%和76.33%,取得了较好的分割结果。 展开更多
关键词 编码器-解码器 上下文信息 空间信息 特征融合
下载PDF
预指导的多阶段特征融合的图像语义分割网络
14
作者 王燕 范向辉 王丽康 《计算机应用研究》 CSCD 北大核心 2024年第3期951-955,共5页
针对目前语义分割对图像边缘和小物体不能进行精确识别,以及简单融合多阶段特征会造成信息冗余、混杂不清等问题,提出了一个预指导的多阶段特征融合的网络(pre-guidanced multi-stage feature fusion network,PGMFFNet),PGMFFNet采用编... 针对目前语义分割对图像边缘和小物体不能进行精确识别,以及简单融合多阶段特征会造成信息冗余、混杂不清等问题,提出了一个预指导的多阶段特征融合的网络(pre-guidanced multi-stage feature fusion network,PGMFFNet),PGMFFNet采用编解码器结构,编码阶段利用预指导模块对各阶段信息进行指导,增强各阶段特征之间的联系,解决各阶段特征在后续融合过程中产生的语义混杂问题。在解码阶段,利用多路径金字塔上采样模块融合高级语义特征,然后使用改进的密集空洞空间金字塔池化模块对融合后的特征进一步扩大感受野,最后将高低层次的特征信息融合,使得对小物体的分割效果更优。PGMFFNet在CityScapes公开数据集上进行了验证,得到了78.38%的平均交并比(mean intersection over union,MIoU),分割效果较好。 展开更多
关键词 语义分割 编解码器 预指导 金字塔 特征融合
下载PDF
基于深度SSDAE网络的刀具磨损状态识别
15
作者 郭润兰 尉卫卫 +1 位作者 王广书 黄华 《振动.测试与诊断》 EI CSCD 北大核心 2024年第2期305-312,410,411,共10页
针对刀具磨损状态识别过程中采集数据量大、干扰信号复杂且需人为选择特征参数的问题,为提高刀具磨损状态识别模型的鲁棒性与泛化性,提出了一种数据驱动下深度堆叠稀疏降噪自编码(stacking sparse denoising auto-encoder,简称SSDAE)网... 针对刀具磨损状态识别过程中采集数据量大、干扰信号复杂且需人为选择特征参数的问题,为提高刀具磨损状态识别模型的鲁棒性与泛化性,提出了一种数据驱动下深度堆叠稀疏降噪自编码(stacking sparse denoising auto-encoder,简称SSDAE)网络的刀具磨损状态识别方法,实现隐藏在数据中深层次的数据特征自动挖掘。首先,将原始振动信号分解为一系列固有模态分量(intrinsic mode function,简称IMF),并采用皮尔逊相关系数法选取了最优固有模态来组合一个新的信号;其次,采用SSDAE网络自适应提取特征后对刀具磨损阶段进行了状态识别,识别精度达到98%;最后,对网络模型进行实验验证,并与最常用的刀具磨损状态识别方法进行了对比。实验结果表明,所提出的方法能够很好地处理非平稳振动信号,对不同刀具磨损阶段状态的识别效果良好,并具有较好的泛化性能和可靠性。 展开更多
关键词 深度堆叠稀疏自编码网络 变分模态分解 K-最近邻分类器 自适应特征提取 状态识别
下载PDF
基于改进沙漏的攀岩运动关键点检测算法
16
作者 谭光兴 唐天南 +1 位作者 易彤 陈海峰 《现代电子技术》 北大核心 2024年第17期117-122,共6页
针对关键点检测中目标尺度多变以及不同特征适应性等难题,为进一步提升现有的姿态估计方法在实现姿态估计任务时的性能,验证单阶段和多阶段姿态估计方法各自的有效性,提出一种基于改进沙漏的攀岩运动关键点检测算法。首先设计一个多路... 针对关键点检测中目标尺度多变以及不同特征适应性等难题,为进一步提升现有的姿态估计方法在实现姿态估计任务时的性能,验证单阶段和多阶段姿态估计方法各自的有效性,提出一种基于改进沙漏的攀岩运动关键点检测算法。首先设计一个多路池化残差结构,改善由于沙漏网络多次上下采样带来的信息损失和上下文信息提取不足的局限性,提升浅层特征在关键点检测中的表现;其次在沙漏网络中引入沙漏注意力结构,通过利用特征映射将输入信息划分为不同大小的特征块序列,在特征编码和特征解码两个过程中,充分挖掘图像有效信息,使得在特征匹配过程中不仅考虑本身的拟合程度,更考虑到关节位置之间的关联信息。实验表明,提出的算法在公开数据集MPII、COCO和针对攀岩运动的数据集上表现良好,且算法泛化能力较好,能够应用于多种运动场景中的人体关键点检测任务。 展开更多
关键词 沙漏注意力 关键点检测 攀岩运动 多路池化 关联信息 特征编码 特征映射
下载PDF
基于语义信息的无监督单目深度估计
17
作者 李颀 李煜哲 《传感器与微系统》 CSCD 北大核心 2024年第9期157-160,共4页
随着深度学习的发展,无监督单目深度估计成为计算机视觉的研究热点。由于深度图存在轮廓不清晰、深度估计不准确等问题,以编—解码器结构为基础,提出一种基于语义信息的无监督单目深度估计网络,为了获取更为清晰的轮廓信息,本文在编解... 随着深度学习的发展,无监督单目深度估计成为计算机视觉的研究热点。由于深度图存在轮廓不清晰、深度估计不准确等问题,以编—解码器结构为基础,提出一种基于语义信息的无监督单目深度估计网络,为了获取更为清晰的轮廓信息,本文在编解码器之间通过空洞空间卷积池化金字塔(ASPP)层进行语义信息的细化,提高生成的图像质量;该网络通过在编码器到解码器的跳层连接实现对多分辨率特征的提取,在编码器部分采用改进的高分辨率网络(HRNet)融合不同层的多分辨率特征,在解码前使用串联策略融合中间阶段的输出,提高深度估计的准确率。在KITTI数据集上的实验结果表明,本文方法的误差评价指标相较于目前的深度估计方法更低,在3个深度估计准确率评价指标上达到了89.4%,96.3%,98.1%,具有较好的准确性。 展开更多
关键词 深度估计 无监督学习 多分辨率特征 语义信息 编—解码结构
下载PDF
基于视觉Transformer和双解码器的红外小目标检测方法
18
作者 代少升 刘科生 +3 位作者 黄炼 贺自强 毛兴华 任汶皓 《红外技术》 CSCD 北大核心 2024年第9期1070-1080,共11页
当前基于卷积神经网络的红外小目标检测方法在编码器阶段受限于感受野,且解码器在多尺度特征融合中缺乏有效的特征交互。本文提出了一种基于编码器-解码器结构的新方法,针对现有红外小目标检测方法中的问题进行改进。该方法使用视觉Tran... 当前基于卷积神经网络的红外小目标检测方法在编码器阶段受限于感受野,且解码器在多尺度特征融合中缺乏有效的特征交互。本文提出了一种基于编码器-解码器结构的新方法,针对现有红外小目标检测方法中的问题进行改进。该方法使用视觉Transformer作为编码器,能够有效地提取红外小目标图像的多尺度特征。视觉Transformer是一种新兴的深度学习架构,其通过自注意力机制捕捉图像中像素之间的全局关系,以处理长程依赖性和上下文信息。此外,本文还设计了一个由交互式解码器和辅助解码器组成的双解码器模块,旨在提高解码器对红外小目标的重构能力。该双解码器模块能够充分利用不同特征之间的互补信息,促进深层特征和浅层特征之间的交互,并通过将两个解码器的结果进行叠加,以更好地重构红外小目标。在广泛使用的公共数据集上的实验结果表明,本文提出的方法在F1和mIoU两个评价指标上的性能优于其他对比方法。 展开更多
关键词 红外小目标检测 视觉Transformer 多尺度特征融合 编解码结构
下载PDF
计算机图像智能识别下的割草机器人设计研究
19
作者 袁社锋 《农机化研究》 北大核心 2024年第11期136-139,共4页
为了提升割草机器人的工作效率、安全及自主性,基于堆叠降噪自动编码机设计了智能图像识别算法,用于实现割草机器人进行作业时自动化识别环境,以进一步提高工作效率。将割草机器人视觉传感器所采集的草地图像作为输入信号,通过叠加多层... 为了提升割草机器人的工作效率、安全及自主性,基于堆叠降噪自动编码机设计了智能图像识别算法,用于实现割草机器人进行作业时自动化识别环境,以进一步提高工作效率。将割草机器人视觉传感器所采集的草地图像作为输入信号,通过叠加多层自动降噪编码机组成深度神经网络,可以深入挖掘草地图像所携带的信息,识别并提取图像特征。通过训练所建立网络,获得稳定输出,提高了割草机器人识别目标准确率。试验结果表明:本算法可进一步提高割草机器人识别准确率,从而提高工作效率。 展开更多
关键词 图像识别 机器学习 特征提取 降噪自动编码机 割草机器人
下载PDF
结合密集注意力的自适应特征融合图像去雾网络
20
作者 王燕 他雪 卢鹏屹 《计算机系统应用》 2024年第2期72-82,共11页
目前,大多数图像去雾算法忽视图像的局部细节信息,无法充分利用不同层次的特征,导致恢复的无雾图像仍存在颜色失真、对比度下降和雾霾残留现象,针对这一问题,提出结合密集注意力的自适应特征融合图像去雾网络.该网络以编码器-解码器结... 目前,大多数图像去雾算法忽视图像的局部细节信息,无法充分利用不同层次的特征,导致恢复的无雾图像仍存在颜色失真、对比度下降和雾霾残留现象,针对这一问题,提出结合密集注意力的自适应特征融合图像去雾网络.该网络以编码器-解码器结构为基本框架,中间嵌入特征增强部分与特征融合部分,通过在特征增强部分叠加由密集残差网络与CS联合注意模块构成的密集特征注意块,使网络可以关注图像的局部细节信息,同时增强特征的重复利用,有效防止梯度消失;在特征融合部分构建自适应特征融合模块融合低级与高级特征,防止因网络加深而造成浅层特征退化.实验结果表明,所提算法在合成有雾图像数据集和真实有雾图像数据集上均表现优异,在SOTS室内合成数据集上的峰值信噪比和结构相似性分别达到了35.81 dB和0.9889,在真实图像数据集O-HAZE上的峰值信噪比和结构相似性分别达到了22.75 dB和0.7788,有效解决了颜色失真、对比度下降和雾霾残留等问题. 展开更多
关键词 图像去雾 深度学习 编码器-解码器 密集连接 注意力机制 特征融合
下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部