期刊文献+
共找到275篇文章
< 1 2 14 >
每页显示 20 50 100
A Power Data Anomaly Detection Model Based on Deep Learning with Adaptive Feature Fusion
1
作者 Xiu Liu Liang Gu +3 位作者 Xin Gong Long An Xurui Gao Juying Wu 《Computers, Materials & Continua》 SCIE EI 2024年第6期4045-4061,共17页
With the popularisation of intelligent power,power devices have different shapes,numbers and specifications.This means that the power data has distributional variability,the model learning process cannot achieve suffi... With the popularisation of intelligent power,power devices have different shapes,numbers and specifications.This means that the power data has distributional variability,the model learning process cannot achieve sufficient extraction of data features,which seriously affects the accuracy and performance of anomaly detection.Therefore,this paper proposes a deep learning-based anomaly detection model for power data,which integrates a data alignment enhancement technique based on random sampling and an adaptive feature fusion method leveraging dimension reduction.Aiming at the distribution variability of power data,this paper developed a sliding window-based data adjustment method for this model,which solves the problem of high-dimensional feature noise and low-dimensional missing data.To address the problem of insufficient feature fusion,an adaptive feature fusion method based on feature dimension reduction and dictionary learning is proposed to improve the anomaly data detection accuracy of the model.In order to verify the effectiveness of the proposed method,we conducted effectiveness comparisons through elimination experiments.The experimental results show that compared with the traditional anomaly detection methods,the method proposed in this paper not only has an advantage in model accuracy,but also reduces the amount of parameter calculation of the model in the process of feature matching and improves the detection speed. 展开更多
关键词 Data alignment dimension reduction feature fusion data anomaly detection deep learning
下载PDF
Adequate alignment and interaction for cross-modal retrieval
2
作者 Mingkang WANG Min MENG +1 位作者 Jigang LIU Jigang WU 《Virtual Reality & Intelligent Hardware》 EI 2023年第6期509-522,共14页
Background Cross-modal retrieval has attracted widespread attention in many cross-media similarity search applications,particularly image-text retrieval in the fields of computer vision and natural language processing... Background Cross-modal retrieval has attracted widespread attention in many cross-media similarity search applications,particularly image-text retrieval in the fields of computer vision and natural language processing.Recently,visual and semantic embedding(VSE)learning has shown promising improvements in image text retrieval tasks.Most existing VSE models employ two unrelated encoders to extract features and then use complex methods to contextualize and aggregate these features into holistic embeddings.Despite recent advances,existing approaches still suffer from two limitations:(1)without considering intermediate interactions and adequate alignment between different modalities,these models cannot guarantee the discriminative ability of representations;and(2)existing feature aggregators are susceptible to certain noisy regions,which may lead to unreasonable pooling coefficients and affect the quality of the final aggregated features.Methods To address these challenges,we propose a novel cross-modal retrieval model containing a well-designed alignment module and a novel multimodal fusion encoder that aims to learn the adequate alignment and interaction of aggregated features to effectively bridge the modality gap.Results Experiments on the Microsoft COCO and Flickr30k datasets demonstrated the superiority of our model over state-of-the-art methods. 展开更多
关键词 cross-modal retrieval Visual semantic embedding feature aggregation Transformer
下载PDF
Feature Extraction of Kernel Regress Reconstruction for Fault Diagnosis Based on Self-organizing Manifold Learning 被引量:3
3
作者 CHEN Xiaoguang LIANG Lin +1 位作者 XU Guanghua LIU Dan 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2013年第5期1041-1049,共9页
The feature space extracted from vibration signals with various faults is often nonlinear and of high dimension.Currently,nonlinear dimensionality reduction methods are available for extracting low-dimensional embeddi... The feature space extracted from vibration signals with various faults is often nonlinear and of high dimension.Currently,nonlinear dimensionality reduction methods are available for extracting low-dimensional embeddings,such as manifold learning.However,these methods are all based on manual intervention,which have some shortages in stability,and suppressing the disturbance noise.To extract features automatically,a manifold learning method with self-organization mapping is introduced for the first time.Under the non-uniform sample distribution reconstructed by the phase space,the expectation maximization(EM) iteration algorithm is used to divide the local neighborhoods adaptively without manual intervention.After that,the local tangent space alignment(LTSA) algorithm is adopted to compress the high-dimensional phase space into a more truthful low-dimensional representation.Finally,the signal is reconstructed by the kernel regression.Several typical states include the Lorenz system,engine fault with piston pin defect,and bearing fault with outer-race defect are analyzed.Compared with the LTSA and continuous wavelet transform,the results show that the background noise can be fully restrained and the entire periodic repetition of impact components is well separated and identified.A new way to automatically and precisely extract the impulsive components from mechanical signals is proposed. 展开更多
关键词 feature extraction manifold learning self-organize mapping kernel regression local tangent space alignment
下载PDF
自适应特征融合的多模态实体对齐研究
4
作者 郭浩 李欣奕 +2 位作者 唐九阳 郭延明 赵翔 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期758-770,共13页
多模态数据间交互式任务的兴起对于综合利用不同模态的知识提出了更高的要求,因此融合不同模态知识的多模态知识图谱应运而生.然而,现有多模态知识图谱存在图谱知识不完整的问题,严重阻碍对信息的有效利用.缓解此问题的有效方法是通过... 多模态数据间交互式任务的兴起对于综合利用不同模态的知识提出了更高的要求,因此融合不同模态知识的多模态知识图谱应运而生.然而,现有多模态知识图谱存在图谱知识不完整的问题,严重阻碍对信息的有效利用.缓解此问题的有效方法是通过实体对齐进行知识图谱补全.当前多模态实体对齐方法以固定权重融合多种模态信息,在融合过程中忽略不同模态信息贡献的差异性.为解决上述问题,设计一套自适应特征融合机制,根据不同模态数据质量动态融合实体结构信息和视觉信息.此外,考虑到视觉信息质量不高、知识图谱之间的结构差异也影响实体对齐的效果,本文分别设计提升视觉信息有效利用率的视觉特征处理模块以及缓和结构差异性的三元组筛选模块.在多模态实体对齐任务上的实验结果表明,提出的多模态实体对齐方法的性能优于当前最好的方法. 展开更多
关键词 多模态知识图谱 实体对齐 预训练模型 特征融合
下载PDF
基于联合深度统计特征对齐的鱼类目标识别方法
5
作者 王海燕 杜菲瑀 +1 位作者 姚海洋 陈晓 《陕西科技大学学报》 北大核心 2024年第3期182-187,196,共7页
水下鱼类目标识别技术是认识海洋、经略海洋、向海图强的重要技术之一.基于深度学习的水下目标识别技术已成为研究热点,但是针对水下鱼类数据小样本甚至零样本识别性能亟待提高.本文基于迁移学习,提出了联合深度统计特征对齐(Joint Deep... 水下鱼类目标识别技术是认识海洋、经略海洋、向海图强的重要技术之一.基于深度学习的水下目标识别技术已成为研究热点,但是针对水下鱼类数据小样本甚至零样本识别性能亟待提高.本文基于迁移学习,提出了联合深度统计特征对齐(Joint Deep Statistical Feature Alignment, JDSFA)方法,解决小样本下的鱼类目标识别问题.以ResNet-50作为骨干网络,将均方和协方差纳入权重选择算法用来构建自适应损失函数,对齐源域和目标域之间的特征分布,联合源域损失与领域间的自适应损失,设计全局损失函数,建立深度学习识别模型,实现鱼类目标识别任务.利用公开的水下鱼类数据集QUT进行实验验证,相比目前代表性的DADAN、PMTrans、DSAN方法,JDSFA方法的鱼类识别性能分别提升了3.59%、4.96%、5.91%,结果表明了本文JDSFA方法的有效性,并对鱼类目标识别具有良好的应用价值. 展开更多
关键词 鱼类识别 迁移学习 联合深度统计特征对齐 损失函数
下载PDF
结合坐标Transformer的轻量级人体姿态估计算法
6
作者 黄友文 林志钦 +1 位作者 章劲 陈俊宽 《图学学报》 CSCD 北大核心 2024年第3期516-527,共12页
针对现有的大多数自底向上人体姿态估计算法存在模型规模大、计算成本高及对边缘设备不友好等问题,提出了一种基于YOLOv5s6-Pose的轻量级多人姿态估计网络模型YOLOv5s6-Pose-CT。该模型在颈部网络中引入空间和通道重建卷积,以减少空间... 针对现有的大多数自底向上人体姿态估计算法存在模型规模大、计算成本高及对边缘设备不友好等问题,提出了一种基于YOLOv5s6-Pose的轻量级多人姿态估计网络模型YOLOv5s6-Pose-CT。该模型在颈部网络中引入空间和通道重建卷积,以减少空间和通道维度上的特征冗余。同时,提出了一种坐标Transformer嵌入于主干网络中,使模型专注于长距离依赖和拥有高效的局部特征提取能力。其次,通过使用无偏特征位置对齐来解决多尺度融合过程中出现的特征错位问题。最后,使用损失函数MPDIoU对边界框的回归损失重新定义。在COCO 2017数据集上的实验结果表明,本文优化的网络模型与主流的轻量级网络EfficientHRNet-H1模型相比,在保持相同精度的同时,参数量和计算量分别减少16.2%和66.1%。相比于基准模型YOLOv5s6-Pose,参数量减少11.2%,计算量降低5.8%,平均检测精度和平均召回率分别提升2.5%和2.6%。 展开更多
关键词 人体姿态估计 轻量级 坐标Transformer 无偏特征位置对齐 损失函数
下载PDF
迁移学习在机械设备故障诊断领域的进展研究
7
作者 陈驻民 韦继程 《机械管理开发》 2024年第3期96-99,共4页
迁移学习是一种新兴的机器学习方法,通过运用已学习的知识对不同但相关领域问题进行求解,能够较为有效的解决模型泛化能力弱、样本数据不足等问题。针对迁移学习在机械设备故障诊断领域的应用方法进行了综述,总结了三类关于迁移学习的... 迁移学习是一种新兴的机器学习方法,通过运用已学习的知识对不同但相关领域问题进行求解,能够较为有效的解决模型泛化能力弱、样本数据不足等问题。针对迁移学习在机械设备故障诊断领域的应用方法进行了综述,总结了三类关于迁移学习的诊断预测方法,并对迁移学习在故障诊断领域的未来研究方向进行了探讨。 展开更多
关键词 迁移学习 故障诊断 参数微调 特征对齐 生成对抗网络
下载PDF
基于ResCNN-BiGRU的四川方言语音识别 被引量:2
8
作者 谢金洪 魏霞 《现代电子技术》 北大核心 2024年第1期89-93,共5页
由于基于深度卷积神经网络的语音识别模型中缺乏对特定方言音素特征的提取能力,造成方言发音底层特征部分信息丢失,进而导致方言识别准确率不高、鲁棒性差等问题。针对上述问题,提出一种结合残差网络(RestNet)和双向门控循环网络(BiGRU... 由于基于深度卷积神经网络的语音识别模型中缺乏对特定方言音素特征的提取能力,造成方言发音底层特征部分信息丢失,进而导致方言识别准确率不高、鲁棒性差等问题。针对上述问题,提出一种结合残差网络(RestNet)和双向门控循环网络(BiGRU)的模型,该模型以GFCC特征图为输入,同时在残差网络中设计多尺度卷积模块,通过不同大小的卷积核提取特征,然后使用双向门控循环网络捕捉序列数据中的长期依赖关系,最后采用连接时序分类算法进行标签软对齐,实现四川方言语音识别模型。在四川方言语料库上的实验结果表明,提出的模型识别性能优于现有基准模型。 展开更多
关键词 四川方言 音素特征 双向门控循环网络 多尺度卷积 连接时序分类 标签软对齐
下载PDF
深度语义关联学习的基于图像视觉数据跨域检索
9
作者 焦世超 关日鹏 +2 位作者 况立群 熊风光 韩燮 《计算机工程》 CAS CSCD 北大核心 2024年第5期190-199,共10页
基于图像的视觉数据跨域检索任务旨在搜索与输入图像在语义上一致或外形上相似的跨域图像和三维模型数据,其面临的主要问题是处理跨域数据之间的模态异质性。现有方法通过构建公共特征空间,采用域适应算法或深度度量学习算法实现跨域特... 基于图像的视觉数据跨域检索任务旨在搜索与输入图像在语义上一致或外形上相似的跨域图像和三维模型数据,其面临的主要问题是处理跨域数据之间的模态异质性。现有方法通过构建公共特征空间,采用域适应算法或深度度量学习算法实现跨域特征的域对齐或语义对齐,其有效性仅在单一类型的跨域检索任务中进行了验证。提出一种基于深度语义关联学习的方法,以适用多种类型的基于图像的跨域视觉数据检索任务。首先,使用异构网络提取跨域数据的初始视觉特征;然后,通过构建公共特征空间实现初始特征映射,以便进行后续的域对齐和语义对齐;最后,通过域内鉴别性学习、域间一致性学习和跨域相关性学习,消除跨域数据特征之间的异质性,探索跨域数据特征之间的语义相关性,并为检索任务生成鲁棒且统一的特征表示。实验结果表明,该方法在TU-Berlin、IM2MN和MI3DOR数据集中的平均精度均值(mAP)分别达到0.448、0.689和0.874,明显优于对比方法。 展开更多
关键词 跨域检索 特征对齐 域对齐 草图 真实图像 三维模型 相关性学习
下载PDF
基于语义一致性约束与局部-全局感知的多模态3D视觉定位
10
作者 罗寒 马浩统 +2 位作者 刘杰 严华 雷印杰 《计算机应用研究》 CSCD 北大核心 2024年第7期2203-2208,共6页
3D多模态数据稀缺,使得传统方法进行监督训练时文本与视觉特征缺乏语义一致性。同时传统方法还易忽视局部关系与全局信息,从而导致性能不佳。针对上述问题,提出了一种基于语义一致性约束与局部-全局感知的多模态3D视觉定位方法。首先,... 3D多模态数据稀缺,使得传统方法进行监督训练时文本与视觉特征缺乏语义一致性。同时传统方法还易忽视局部关系与全局信息,从而导致性能不佳。针对上述问题,提出了一种基于语义一致性约束与局部-全局感知的多模态3D视觉定位方法。首先,该方法通过蒸馏2D预训练视觉语言模型知识,帮助3D模型提取到点云-文本语义一致性特征;其次设计了局部-全局感知模块,不断补充增强候选目标特征,以更精确匹配目标。在现有的3D视觉定位数据集ScanRefer上进行的实验表明,该方法在Acc@0.25 IoU和Acc@0.5 IoU两个指标上分别达到了50.53%和37.67%,超越了现有大多数3D视觉定位算法,证实了该方法的有效性。 展开更多
关键词 3D视觉定位 多模态 特征一致性约束 局部关系 全局位置信息
下载PDF
融合注意力机制的DeeplabV3+服装图像分割方法
11
作者 肖雅慧 张自力 +2 位作者 胡新荣 彭涛 张俊 《计算机科学》 CSCD 北大核心 2024年第S01期581-587,共7页
针对在服装图像语义分割中存在由服装颜色、纹理、背景以及多目标遮挡导致的边缘分割粗糙和分割精度低等问题,文中基于Deeplabv3+框架,提出了一种图像语义分割算法(FFDNet)。首先,模型的骨干网络采用ResNet101网络,并添加通道空间注意... 针对在服装图像语义分割中存在由服装颜色、纹理、背景以及多目标遮挡导致的边缘分割粗糙和分割精度低等问题,文中基于Deeplabv3+框架,提出了一种图像语义分割算法(FFDNet)。首先,模型的骨干网络采用ResNet101网络,并添加通道空间注意力模块(Feature-Enhanced Attention Module,FEAM),通过对特征图加权来挖掘并增强特征信息,提高网络表达能力。其次引入特征对齐模块(Feature Align Module,FAM)作为一种新的上采样方式,解决不同尺度特征融合之间特征未对齐导致分割错误且效率低的问题,以此提高对服装图像分割的准确性和鲁棒性。最后,FFDNet在Deepfashion2和PASCAL VOC 2012数据集上的平均交并比分别达到55.2%和79.4%;在参数量方面,该模型相比原模型在Deepfashion2上仅增加了0.61 MB。与其他现有经典模型对比,其分割性能更优,能有效捕获图像局部细节信息,减少像素分类错误。 展开更多
关键词 服装图像 语义分割 注意力机制 Deeplabv3+网络 特征对齐
下载PDF
一种基于多层特征对齐的知识蒸馏方法
12
作者 闫泽阳 张宏伟 +2 位作者 王子珍 彭晴晴 魏文豪 《火力与指挥控制》 CSCD 北大核心 2024年第6期193-199,207,共8页
实时目标检测算法(如YOLO)是为在资源有限的边缘设备上高效执行物体检测任务而设计的。因检测性能有限,提出一种基于多层特征对齐的知识蒸馏方法。为有效保留原始数据中的知识,引入将教师和学生模型的多个中间层知识纳入其中的蒸馏指标... 实时目标检测算法(如YOLO)是为在资源有限的边缘设备上高效执行物体检测任务而设计的。因检测性能有限,提出一种基于多层特征对齐的知识蒸馏方法。为有效保留原始数据中的知识,引入将教师和学生模型的多个中间层知识纳入其中的蒸馏指标,根据训练过程中教师模型和学生模型中间层特征的差异,纳入了对齐加权因子。该方法能让学生模型从教师模型的中间层学到更多有用的知识。利用提炼出的知识对现有模型进行了增量训练,避免训练多个独立模型的资源开销。通过不同场景和条件下的实验比较,该方法在降低模型计算和存储成本的同时,有效提高目标识别的准确性。实验分析表明,在YOLO模型基础上提出的多层特征对齐蒸馏算法经COCO2017数据集验证,将学生模型的检测精度从33.3提升到40.7,有效提高模型的检测精度。 展开更多
关键词 知识蒸馏 YOLO算法 多层特征对齐 目标检测
下载PDF
语义流引导采样结合注意力机制的脑肿瘤图像分割
13
作者 宋建丽 吕晓琪 谷宇 《光学精密工程》 EI CAS CSCD 北大核心 2024年第4期565-577,共13页
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首... U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。 展开更多
关键词 脑肿瘤 图像分割 特征对齐 注意力机制 轻量化
下载PDF
基于特征点匹配的排水管道声点云模型配准算法
14
作者 张体浪 徐晓龙 +6 位作者 杨亚峻 许俊松 宋柯 黄英 李志伟 黄俊凯 江雅馨 《计算机测量与控制》 2024年第5期215-223,共9页
三维重建技术逐渐成为获取全面、完备、准确的排水管道信息的关键手段;而实际检测受到管道堵塞等工况与管道检测规程等因素限制,造成所获得的管道声呐点云模型会出现位姿不同、部分重叠或空缺等情况,需要通过配准获取完整管道模型;同时... 三维重建技术逐渐成为获取全面、完备、准确的排水管道信息的关键手段;而实际检测受到管道堵塞等工况与管道检测规程等因素限制,造成所获得的管道声呐点云模型会出现位姿不同、部分重叠或空缺等情况,需要通过配准获取完整管道模型;同时,传统ICP算法针对管道模型存在效率低、精度差的问题;因此,文章提出基于特征点匹配的粗配准与改进的ICP精细配准相结合的点云配准算法;首先,利用ISS特征点检测法检测出模型特征点,通过FPFH对特征点进行进一步的描述;其次,采用RANSAC算法筛选出正确特征匹配点集,利用四元数法解算出初始变换参数完成粗配准;最后,在粗配准基础上,通过改进最近对应点查询的ICP算法完成精细配准;实验结果表明了该文算法的可行性与优越性,能为后续排水管道缺陷检测提供高完备、全面、准确的点云模型。 展开更多
关键词 声呐点云 点云配准 特征匹配 随机采样一致性 迭代最近点
下载PDF
自适应特征融合的迭代实体对齐方法
15
作者 李婷婷 邵斐 +1 位作者 温天晓 董飒 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期629-635,共7页
针对知识图谱实体对齐任务中缺乏训练数据以及长尾实体对齐准确率较低的问题,提出一种基于自适应特征融合策略的迭代实体对齐方法,并设计一种迭代策略自动扩充训练数据的规模.该方法使用知识图谱的结构信息,并利用关系、属性和实体名称... 针对知识图谱实体对齐任务中缺乏训练数据以及长尾实体对齐准确率较低的问题,提出一种基于自适应特征融合策略的迭代实体对齐方法,并设计一种迭代策略自动扩充训练数据的规模.该方法使用知识图谱的结构信息,并利用关系、属性和实体名称信息作为语义信息辅助对齐,从而提升对齐效果.在数据集上的实验结果表明,该模型在知识图谱实体对齐任务中效果良好. 展开更多
关键词 知识图谱 实体对齐 迭代策略 自适应特征融合
下载PDF
基于改进UperNet的结球甘蓝叶球识别方法
16
作者 朱轶萍 吴华瑞 +1 位作者 郭旺 吴小燕 《智慧农业(中英文)》 CSCD 2024年第3期128-137,共10页
[目的/意义]叶球是结球甘蓝的重要部分,其生长发育对田间管理至关重要。针对叶球分割识别存在大田背景复杂、光照不均匀和叶片纹理相似等问题,提出一种语义分割算法UperNet-ESA,旨在能快速、准确地分割田间场景中结球甘蓝的外叶和叶球,... [目的/意义]叶球是结球甘蓝的重要部分,其生长发育对田间管理至关重要。针对叶球分割识别存在大田背景复杂、光照不均匀和叶片纹理相似等问题,提出一种语义分割算法UperNet-ESA,旨在能快速、准确地分割田间场景中结球甘蓝的外叶和叶球,以实现田间结球甘蓝的智能化管理。[方法]首先,采用统一感知解析网络(Unified Perceptual Parsing Network,UperNet)作为高效语义分割框架,将主干网络改为先进的ConvNeXt,使得模型在提升分割精度的同时也能具有较低的模型复杂度;其次,利用高效通道注意力机制(Efficient Channel Attention,ECA)融入特征提取网络的各阶段,进一步捕捉图像的细节信息;最后,通过将特征选择模块(Feature Selection Model,FSM)和特征对齐模块(Feature Alignment Model,FAM)集成到特征金字塔框架中,得到更为精确的目标边界预测结果。[结果和讨论]在自制结球甘蓝图像数据集上进行实验,与目前主流的UNet、PSPNet和DeeplabV3+语义分割模型相比,改进UperNet方法的平均交并比为92.45%,平均像素准确率为94.32%,推理速度为16.6 f/s,能够达到最佳精度-速度平衡效果。[结论]研究成果可为结球甘蓝生长智能化监测提供理论参考,对甘蓝产业发展具有重要的应用前景。 展开更多
关键词 结球甘蓝 语义分割 叶球识别 注意力机制 特征选择 特征对齐
下载PDF
基于关系挖掘的跨模态行人重识别
17
作者 金昌胜 王海瑞 《空军工程大学学报》 CSCD 北大核心 2024年第1期106-114,共9页
基于文本的行人重识别模型通常依赖于全局特征对齐和局部特征对齐,但模态间和模态内的相关信息常被忽略。提出了一种基于关系挖掘的跨模态行人重识别方法,该方法包括双流主干网络、负相似度挖掘模块、关系编码器。首先,通过双流主干网... 基于文本的行人重识别模型通常依赖于全局特征对齐和局部特征对齐,但模态间和模态内的相关信息常被忽略。提出了一种基于关系挖掘的跨模态行人重识别方法,该方法包括双流主干网络、负相似度挖掘模块、关系编码器。首先,通过双流主干网络实现了全局和局部特征对齐;其次,通过负相似度挖掘模块提升了图像-文本对特征辨别的细粒度;最后,通过关系编码器模块分别学习图像和文本中隐含的关系信息,实现关系级别的特征对齐。在CUHK-PEDES数据集和ICFG-PEDES数据集上的实验结果证明,文中方法能够达到较高的识别精度。 展开更多
关键词 行人重识别 多粒度图像 文本对齐 关系特征融合 卷积神经网络 全局特征 局部特征
下载PDF
单源域泛化中一种基于域增强和特征对齐的元学习方案
18
作者 孙灿 胡志刚 郑浩 《计算机应用研究》 CSCD 北大核心 2024年第8期2392-2397,共6页
基于元学习的单源域泛化(single domain generalization,SDG)已成为解决领域偏移问题的有效技术之一。然而,源域和增强域的语义信息不一致以及域不变特征和域相关特征难以分离,使SDG模型难以实现良好的泛化性能。针对上述问题,提出了一... 基于元学习的单源域泛化(single domain generalization,SDG)已成为解决领域偏移问题的有效技术之一。然而,源域和增强域的语义信息不一致以及域不变特征和域相关特征难以分离,使SDG模型难以实现良好的泛化性能。针对上述问题,提出了一种单源域泛化中基于域增强和特征对齐的元学习方案(meta-learning based on domain enhancement and feature alignment,MetaDefa)。利用背景替换和视觉损害技术为每一张图像生成多样且有效的增强图像,保证了源域和增强域之间的语义信息一致性;多通道特征对齐模块通过关注源域和增强域特征空间之间的相似目标区域和抑制非目标区域的特征表示充分挖掘图像信息,进而有效地提取充足的可迁移性知识。通过实验评估,MetaDefa在office-Caltech-10、office31和PACS数据集上分别取得了88.87%、73.06%和57.06%的精确度。结果表明,MetaDefa方法成功实现了源图像和增强图像之间的语义一致性和对域不变特征的充分提取,从而显著提升了单源域泛化模型的泛化性能。 展开更多
关键词 单源域泛化 元学习 域增强 特征对齐
下载PDF
基于域对抗统计特性增强的跨域故障诊断方法
19
作者 朱俞豪 张淞钊 张永 《计算机科学》 CSCD 北大核心 2024年第S01期1163-1168,共6页
故障诊断对于保障大型机械设备安全稳定运行具有十分重要的意义,但获得的数据存在严重标签缺失或缺少的问题,且不同工况下的数据特征分布显著不同。传统机器学习或微调的方法存在特征提取模式单一、视角固定的局限性,使得同类不同域的... 故障诊断对于保障大型机械设备安全稳定运行具有十分重要的意义,但获得的数据存在严重标签缺失或缺少的问题,且不同工况下的数据特征分布显著不同。传统机器学习或微调的方法存在特征提取模式单一、视角固定的局限性,使得同类不同域的特征难以对齐。针对以上问题,文中提出了一种基于域对抗统计特性增强的跨域故障诊断方法DASEM(Domain-Adversarial Statistical Enhancement Model)。该方法采用直推式深度迁移学习技术,在域对抗框架下增强全局统计特性的表示,并与局部结构模式融合,构建双路径特征提取器。同时,利用域标签和数据结构之间的平衡关系来描述域对抗的表现形式,并通过类标签输出故障诊断结果。在西储大学轴承数据集和江南大学轴承数据集上的实验结果显示,DASEM在各个跨域任务上的平均精度分别达到了94.90%和93.15%,证明了该方法的有效性。 展开更多
关键词 故障诊断 特征分布对齐 域对抗 全局统计特性
下载PDF
基于改进特征融合的口罩检测算法
20
作者 曹琦 武友新 《计算机工程与设计》 北大核心 2024年第2期524-529,共6页
针对口罩检测模型缺少不规范佩戴分类的检测,精度高与速度快难以兼容的问题,提出一种单阶段口罩规范佩戴实时检测算法,引入轻量提取网络DM-CSP,添加多尺度注意力MCA增强提取能力;针对融合阶段深浅层特征信息不对齐问题,设计特征对齐及... 针对口罩检测模型缺少不规范佩戴分类的检测,精度高与速度快难以兼容的问题,提出一种单阶段口罩规范佩戴实时检测算法,引入轻量提取网络DM-CSP,添加多尺度注意力MCA增强提取能力;针对融合阶段深浅层特征信息不对齐问题,设计特征对齐及选择模块FAS,提出特征增强模块CTM关联特征图谱上下文信息,构建解耦通道进行图像识别,提高算法的识别精度和收敛速度。实验结果表明,改进算法检测精度达到93.2%,较主流算法YOLOv4-Tiny提高4.8%,检测速度和模型容量具有更优性能表现。 展开更多
关键词 口罩检测 图像识别 注意力 特征对齐 特征增强 实时检测 多尺度
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部