期刊文献+
共找到681篇文章
< 1 2 35 >
每页显示 20 50 100
CFSA-Net:Efficient Large-Scale Point Cloud Semantic Segmentation Based on Cross-Fusion Self-Attention 被引量:1
1
作者 Jun Shu Shuai Wang +1 位作者 Shiqi Yu Jie Zhang 《Computers, Materials & Continua》 SCIE EI 2023年第12期2677-2697,共21页
Traditional models for semantic segmentation in point clouds primarily focus on smaller scales.However,in real-world applications,point clouds often exhibit larger scales,leading to heavy computational and memory requ... Traditional models for semantic segmentation in point clouds primarily focus on smaller scales.However,in real-world applications,point clouds often exhibit larger scales,leading to heavy computational and memory requirements.The key to handling large-scale point clouds lies in leveraging random sampling,which offers higher computational efficiency and lower memory consumption compared to other sampling methods.Nevertheless,the use of random sampling can potentially result in the loss of crucial points during the encoding stage.To address these issues,this paper proposes cross-fusion self-attention network(CFSA-Net),a lightweight and efficient network architecture specifically designed for directly processing large-scale point clouds.At the core of this network is the incorporation of random sampling alongside a local feature extraction module based on cross-fusion self-attention(CFSA).This module effectively integrates long-range contextual dependencies between points by employing hierarchical position encoding(HPC).Furthermore,it enhances the interaction between each point’s coordinates and feature information through cross-fusion self-attention pooling,enabling the acquisition of more comprehensive geometric information.Finally,a residual optimization(RO)structure is introduced to extend the receptive field of individual points by stacking hierarchical position encoding and cross-fusion self-attention pooling,thereby reducing the impact of information loss caused by random sampling.Experimental results on the Stanford Large-Scale 3D Indoor Spaces(S3DIS),Semantic3D,and SemanticKITTI datasets demonstrate the superiority of this algorithm over advanced approaches such as RandLA-Net and KPConv.These findings underscore the excellent performance of CFSA-Net in large-scale 3D semantic segmentation. 展开更多
关键词 Semantic segmentation large-scale point cloud random sampling cross-fusion self-attention
下载PDF
农科特色有机化学课程的教学探索与实践 被引量:1
2
作者 万福贤 李映 +4 位作者 张元红 朱树华 徐静 王艳芳 张丽丽 《大学化学》 CAS 2024年第2期298-306,共9页
立足高等农林教育,从教学案例、教学方法、教师团队建设等方面对有机化学课程教学进行了探索和实践。教学实践表明,激发了学生的学习兴趣,拓展了学生的视野,助力学生领略了有机化学研究前沿(尤其是与农科交叉融合应用前沿)魅力,培养了... 立足高等农林教育,从教学案例、教学方法、教师团队建设等方面对有机化学课程教学进行了探索和实践。教学实践表明,激发了学生的学习兴趣,拓展了学生的视野,助力学生领略了有机化学研究前沿(尤其是与农科交叉融合应用前沿)魅力,培养了学生的文化素养、职业素养和科学素养,塑造了学生“知农爱农”的情怀,厚植了学生的家国情怀;实现了知识传授、能力培养与价值引领的同向同行和交相辉映,有效解决了公共基础课与专业教育需求不能完全匹配的问题,充分发挥了课程在农科人才培养中的作用。 展开更多
关键词 有机化学 农科 案例教学 课程思政 交叉融合创新
下载PDF
AF-CenterNet:基于交叉注意力机制的毫米波雷达和相机融合的目标检测 被引量:1
3
作者 车俐 吕连辉 蒋留兵 《计算机应用研究》 CSCD 北大核心 2024年第4期1258-1263,共6页
对于自动驾驶领域而言,确保在各种天气和光照条件下精确检测其他车辆目标是至关重要的。针对单个传感器获取信息的局限性,提出一种基于cross-attention注意力机制的融合方法(AF),用于在特征层面上融合毫米波雷达和相机信息。首先,将毫... 对于自动驾驶领域而言,确保在各种天气和光照条件下精确检测其他车辆目标是至关重要的。针对单个传感器获取信息的局限性,提出一种基于cross-attention注意力机制的融合方法(AF),用于在特征层面上融合毫米波雷达和相机信息。首先,将毫米波雷达和相机进行空间对齐,并将对齐后的点云信息投影成点云图像。然后,将点云图像在高度和宽度方向上进行扩展,以提高相机图像和点云图像之间的匹配度。最后,将点云图像和相机图像送入包含AF结构的CenterNet目标检测网络中进行训练,并生成一个空间注意力权重,以增强相机中的关键特征。实验结果表明,AF结构可以提高原网络检测各种大小目标的性能,特别是对小目标的检测提升更为明显,且对系统的实时性影响不大,是提高车辆在多种场景下检测精度的理想选择。 展开更多
关键词 自动驾驶 目标检测 毫米波雷达 交叉注意力融合
下载PDF
构建“跨情境融合”的大学物理立体化教学体系的探索与实践 被引量:2
4
作者 杨先卫 陈秋紫 +1 位作者 赵小云 杨雄波 《物理通报》 CAS 2024年第1期2-6,共5页
高等院校开设的大学物理课程是培养现代高端工科人才的强大支撑和理论基石,针对学生在学习过程中存在的“3个不足”,以及教学过程中存在的“3个矛盾”,秉持“学生中心、产研教融合”的教学理念,构建了“跨情境融合”的大学物理立体化教... 高等院校开设的大学物理课程是培养现代高端工科人才的强大支撑和理论基石,针对学生在学习过程中存在的“3个不足”,以及教学过程中存在的“3个矛盾”,秉持“学生中心、产研教融合”的教学理念,构建了“跨情境融合”的大学物理立体化教学体系,实施全立体化的学习情境与学习过程,并以此为基础,创建了“三阶递进”的教学内容体系和“三维三结合”的课程评价体系.籍此培养具有创新思维和科学研究能力的创新型工科人才. 展开更多
关键词 跨情境融合 大学物理 立体化教学体系
下载PDF
多层级视频会议系统跨网段融合技术的应用 被引量:1
5
作者 赵士达 马蕴玢 +3 位作者 朱宏 孙选超 杨朝 赵博宇 《华南地震》 2024年第1期105-110,共6页
通过介绍天津市地震局应急视频会议系统接入中国地震局视频会议系统、天津市政府视频系统和天津应急管理局视频系统的基本情况,结合地震应急视频会议系统现状,分析多类型、多层级、多网段视频会议系统的架构特点,着重介绍了多网段、多... 通过介绍天津市地震局应急视频会议系统接入中国地震局视频会议系统、天津市政府视频系统和天津应急管理局视频系统的基本情况,结合地震应急视频会议系统现状,分析多类型、多层级、多网段视频会议系统的架构特点,着重介绍了多网段、多视频源视频转发优化技术在视频会议系统融合中的应用。通过该技术的应用,实现了天津市地震应急视频会议系统与各相关单位视频会议系统的全部连通。 展开更多
关键词 视频会议系统 视频融合 跨网段 视频转发 级联
下载PDF
基于混合特征提取与跨模态特征预测融合的情感识别模型
6
作者 李牧 杨宇恒 柯熙政 《计算机应用》 CSCD 北大核心 2024年第1期86-93,共8页
为从多模态情感分析中有效挖掘单模态表征信息,并实现多模态信息充分融合,提出一种基于混合特征与跨模态预测融合的情感识别模型(H-MGFCT)。首先,利用Mel频率倒谱系数(MFCC)和Gammatone频率倒谱系数(GFCC)及其一阶动态特征融合得到混合... 为从多模态情感分析中有效挖掘单模态表征信息,并实现多模态信息充分融合,提出一种基于混合特征与跨模态预测融合的情感识别模型(H-MGFCT)。首先,利用Mel频率倒谱系数(MFCC)和Gammatone频率倒谱系数(GFCC)及其一阶动态特征融合得到混合特征参数提取算法(H-MGFCC),解决了语音情感特征丢失的问题;其次,利用基于注意力权重的跨模态预测模型,筛选出与语音特征相关性更高的文本特征;随后,加入对比学习的跨模态注意力机制模型对相关性高的文本特征和语音模态情感特征进行跨模态信息融合;最后,将含有文本−语音的跨模态信息特征与筛选出的相关性低的文本特征相融合,以起到信息补充的作用。实验结果表明,该模型在公开IEMOCAP(Interactive EMotional dyadic MOtion CAPture)、CMU-MOSI(CMU-Multimodal Opinion Emotion Intensity)、CMU-MOSEI(CMU-Multimodal Opinion Sentiment Emotion Intensity)数据集上与加权决策层融合的语音文本情感识别(DLFT)模型相比,准确率分别提高了2.83、2.64和3.05个百分点,验证了该模型情感识别的有效性。 展开更多
关键词 特征提取 多模态融合 情感识别 跨模态融合 注意力机制
下载PDF
Transformer-CNN特征跨注意力融合学习的行人重识别
7
作者 项俊 张金城 +1 位作者 江小平 侯建华 《计算机工程与应用》 CSCD 北大核心 2024年第16期94-104,共11页
卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特... 卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特点,在丰富行人局部特征的同时改善特征的全局表达能力。该模型由三个部分构成:CNN分支主要提取局部细节信息;Transformer分支侧重于关注全局特征信息;跨注意力融合分支通过自注意力机制计算上述两个分支特征的相关性,进而实现特征融合,最终提高模型的表征能力。剥离实验以及在Market1501和DukeMTMC-reID数据集的实验结果证明了所提方法的有效性。 展开更多
关键词 行人重识别 卷积神经网络(CNN) TRANSFORMER 跨注意力融合学习
下载PDF
ProNet Adaptive Retinal Vessel Segmentation Algorithm Based on Improved UperNet Network
8
作者 Sijia Zhu Pinxiu Wang Ke Shen 《Computers, Materials & Continua》 SCIE EI 2024年第1期283-302,共20页
This paper proposes a new network structure,namely the ProNet network.Retinal medical image segmentation can help clinical diagnosis of related eye diseases and is essential for subsequent rational treatment.The basel... This paper proposes a new network structure,namely the ProNet network.Retinal medical image segmentation can help clinical diagnosis of related eye diseases and is essential for subsequent rational treatment.The baseline model of the ProNet network is UperNet(Unified perceptual parsing Network),and the backbone network is ConvNext(Convolutional Network).A network structure based on depth-separable convolution and 1×1 convolution is used,which has good performance and robustness.We further optimise ProNet mainly in two aspects.One is data enhancement using increased noise and slight angle rotation,which can significantly increase the diversity of data and help the model better learn the patterns and features of the data and improve the model’s performance.Meanwhile,it can effectively expand the training data set,reduce the influence of noise and abnormal data in the data set on the model,and improve the accuracy and reliability of the model.Another is the loss function aspect,and we finally use the focal loss function.The focal loss function is well suited for complex tasks such as object detection.The function will penalise the loss carried by samples that the model misclassifies,thus enabling better training of the model to avoid these errors while solving the category imbalance problem as a way to improve image segmentation density and segmentation accuracy.From the experimental results,the evaluation metrics mIoU(mean Intersection over Union)enhanced by 4.47%,and mDice enhanced by 2.92% compared to the baseline network.Better generalization effects and more accurate image segmentation are achieved. 展开更多
关键词 Retinal segmentation multifaceted optimization cross-fusion data enhancement focal loss
下载PDF
学科交叉融合在神经学科诊疗创新与人才培养中的应用
9
作者 李昊 牟思奇 +1 位作者 孙旭东 张谦 《医学教育管理》 2024年第2期173-178,共6页
学科交叉融合在神经学科临床上具有广阔的应用前景,可以为临床治疗提供更加全面和精准的支持。随着神经学科日益发展,学科交叉融合已成为神经学科发展的一个重要趋势。在与其他学科的交叉融合中,神经学科可以获得更多的知识和技术,同时... 学科交叉融合在神经学科临床上具有广阔的应用前景,可以为临床治疗提供更加全面和精准的支持。随着神经学科日益发展,学科交叉融合已成为神经学科发展的一个重要趋势。在与其他学科的交叉融合中,神经学科可以获得更多的知识和技术,同时也能够将自身的优势带到其他领域中去。在人才培养方面,学科交叉融合也为培养具备综合素质的医学人才提供了新思路。通过鼓励跨学科交流和合作,搭建合作平台,交叉融合培养出具备跨学科背景的医学人才,为神经学科的发展注入更多新鲜血液。 展开更多
关键词 学科交叉融合 科研素养 医学人才培养 临床神经学科 交叉融合培养
下载PDF
基于数据驱动的动车组镍镉电池记忆效应消除策略研究
10
作者 于天剑 冯恩来 伍珣 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第5期1747-1760,共14页
在碱性镍镉蓄电池长期未彻底充放电的情况下,蓄电池会产生次级放电平台,称为“记忆效应”。该效应会导致电池可释放容量降低,需要定期消除。在动车组蓄电池检修中,传统的“记忆效应”消除方法耗时过长,会对检修工作带来很大压力。为了... 在碱性镍镉蓄电池长期未彻底充放电的情况下,蓄电池会产生次级放电平台,称为“记忆效应”。该效应会导致电池可释放容量降低,需要定期消除。在动车组蓄电池检修中,传统的“记忆效应”消除方法耗时过长,会对检修工作带来很大压力。为了降低储能检修成本,对动车组镍镉电池“记忆效应”消除策略优化方案开展研究。以实际动车组三级修镍镉蓄电池电池为研究对象,通过分析电池的充放电循环中的参数特征,结合大量的电池充放电实验,提取出与电池容量密切相关的特征数据。首先,通过特征筛选和降维组合,搭建线性模型和非线性模型的交叉加权耦合方法,创建近似模型以反映电池的真实可释放容量,消除镍镉电池不一致性对优化方案实验设计带来的系统误差。其次,在此基础上,通过调整影响电池状态的高影响因子变量,构建正交实验方案。研究动车组镍镉蓄电池“记忆效应”快速、安全的消除策略。最后,通过重复验证实验和安全性检测实验对该策略进行实证,研究结果表明,提出的镍镉蓄电池“记忆效应”消除策略能够有效恢复镍镉电池真实容量,并且能够极大地缩减时间成本(约44.15%),并且有利于缓解蓄电池因过充导致电池劣化现象。该消除方案对于提升动车组镍镉电池的维护效率及确保其安全性具有重要意义。 展开更多
关键词 动车组 镍镉蓄电池 记忆效应 信息挖掘 交叉融合建模方法 正交实验
下载PDF
先天性胫骨假关节的临床治疗新进展
11
作者 吴春星 宁波 《外科研究与新技术(中英文)》 2024年第3期181-185,共5页
先天性胫骨假关节是罕见的先天性胫腓骨骨骼畸形,以骨不连、假关节形成、肢体成角短缩等畸形为主要表现,多合并神经纤维瘤病,治疗极其困难。近年来,随着对先天性胫骨假关节发病机制研究的深入,新型手术方法如胫腓骨“4合1融合术”、“Cr... 先天性胫骨假关节是罕见的先天性胫腓骨骨骼畸形,以骨不连、假关节形成、肢体成角短缩等畸形为主要表现,多合并神经纤维瘤病,治疗极其困难。近年来,随着对先天性胫骨假关节发病机制研究的深入,新型手术方法如胫腓骨“4合1融合术”、“Cross-union内固定法”(胫腓骨交叉融合术)的开展,结合新型药物如双膦酸盐、骨形态发生蛋白的综合使用,其骨愈合率逐渐提高,再骨折发生率降低。本文总结了近年来先天性胫骨假关节治疗的现状及进展,以期为临床治疗提供借鉴和思考。 展开更多
关键词 先天性胫骨假关节 4合1融合术 Cross-union内固定法 胫腓骨交叉融合术 骨形态发生蛋白
下载PDF
基于跨模态注意力融合的煤炭异物检测方法 被引量:1
12
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 双特征金字塔网络 跨模态注意力融合 Depth图像 坐标注意力 改进空间注意力
下载PDF
基于遗传算法的双频共孔径稀疏天线阵列
13
作者 蓝海 《固体电子学研究与进展》 CAS 2024年第4期310-314,共5页
针对卫星通信和数据传输等应用,提出了一款基于遗传算法的双频(Ku/S)共孔径稀疏阵列天线。该阵列天线具有剖面低、集成度高、副瓣低等优点。双频天线阵列在单一圆孔径中集成了稀疏排布的高频段(Ku:17 GHz)阵列与低频段(S:2.25 GHz)阵列... 针对卫星通信和数据传输等应用,提出了一款基于遗传算法的双频(Ku/S)共孔径稀疏阵列天线。该阵列天线具有剖面低、集成度高、副瓣低等优点。双频天线阵列在单一圆孔径中集成了稀疏排布的高频段(Ku:17 GHz)阵列与低频段(S:2.25 GHz)阵列,其中高频阵列排布方式基于遗传算法优化得到,具有低副瓣,高增益的特点,并为低频阵列的嵌入提供物理空间;低频阵列以三圈圆环阵列形式嵌入高频阵列中,可进一步优化高频阵列以保持高低频阵列均处于最优状态。所提出的双频天线阵列在60°扫描范围内获得高低频增益分别为26 dBi和15 dBi,均具有≥20 dB的副瓣抑制,且相对于全阵列天线,优化后阵面尺寸仅为原尺寸的60%。 展开更多
关键词 交叉融合 共孔径 稀疏阵 圆环阵 双频
下载PDF
基于知识图谱增强的领域多模态实体识别
14
作者 李华昱 张智康 +1 位作者 闫阳 岳阳 《计算机工程》 CAS CSCD 北大核心 2024年第8期31-39,共9页
针对特定领域中文命名实体识别存在的局限性,提出一种利用学科图谱和图像提高实体识别准确率的模型,旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTMAttention的模型提取文本特征,使用ResNet15... 针对特定领域中文命名实体识别存在的局限性,提出一种利用学科图谱和图像提高实体识别准确率的模型,旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTMAttention的模型提取文本特征,使用ResNet152提取图像特征,并使用分词工具获得句子中的名词实体。通过BERT将名词实体与图谱节点进行特征嵌入,利用余弦相似度查找句子中的分词在学科图谱中最相似的节点,保留到该节点距离为1的邻居节点,生成最佳匹配子图,作为句子的语义补充。使用多层感知机(MLP)将文本、图像和子图3种特征映射到同一空间,并通过独特的门控机制实现文本和图像的细粒度跨模态特征融合。最后,通过交叉注意力机制将多模态特征与子图特征进行融合,输入解码器进行实体标记。在Twitter2015、Twitter2017和自建计算机学科数据集上同基线模型进行实验比较,结果显示,所提方法在领域数据集上的精确率、召回率和F1值分别可达88.56%、87.47%和88.01%,与最优基线模型相比,F1值提高了1.36个百分点,表明利用领域知识图谱能有效提升实体识别效果。 展开更多
关键词 命名实体识别 多模态 领域 知识图谱 跨模态特征融合 注意力机制
下载PDF
结合视觉Transformer和CNN的道路裂缝检测方法
15
作者 代少升 刘科生 余自安 《半导体光电》 CAS 北大核心 2024年第2期252-260,共9页
提出了一种结合视觉Transformer和CNN的道路裂缝检测方法。利用CNN来捕获局部的细节信息,同时利用视觉Transformer来捕获全局特征。通过设计的Fusion特征融合模块将两者提取的特征有机地结合在一起,从而解决了单独使用CNN或视觉Transfor... 提出了一种结合视觉Transformer和CNN的道路裂缝检测方法。利用CNN来捕获局部的细节信息,同时利用视觉Transformer来捕获全局特征。通过设计的Fusion特征融合模块将两者提取的特征有机地结合在一起,从而解决了单独使用CNN或视觉Transformer方法存在的局限。最终将结果传递至交互式解码器,生成道路裂缝的检测结果。实验结果表明,无论是在公开的数据集上还是在自建的数据集上,相较于单独使用CNN或视觉Transformer的方法,所提出的方法在道路裂缝检测任务中有更好的效果。 展开更多
关键词 道路裂缝检测 视觉Transformer和CNN 动态加权交叉特征融合
下载PDF
基于视觉注意力的图文跨模态情感分析 被引量:1
16
作者 王法玉 郝攀征 《计算机工程与设计》 北大核心 2024年第2期601-607,共7页
针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的... 针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的文档表示。对于视觉注意力无法完全覆盖的文本内容,使用BERT模型对文本进行情感分析,得到基于文本的文档表示,将特征进行融合应用于情感分类任务。在Yelp公开餐厅数据集上,该模型相比基线模型TFN-aVGG,准确率提高了43%,相比VistaNet模型准确率提高了1.4%。 展开更多
关键词 情感分析 视觉注意力机制 跨模态 深度学习 特征融合 预训练模型 双向门控单元
下载PDF
基于跨越连接与融合注意力机制的红外弱小目标检测方法
17
作者 李慧 李正周 +2 位作者 杨雨昕 郝聪宇 刘海涛 《光子学报》 EI CAS CSCD 北大核心 2024年第9期218-229,共12页
针对复杂背景红外小弱目标信号弱、特征不明显、干扰虚警多等检测性能低问题,提出基于跨越连接与融合注意力机制的单阶段红外弱小目标检测算法。该方法融合注意力机制与残差网络提取小目标多特征,减少复杂背景干扰;双向跨越连接结构融... 针对复杂背景红外小弱目标信号弱、特征不明显、干扰虚警多等检测性能低问题,提出基于跨越连接与融合注意力机制的单阶段红外弱小目标检测算法。该方法融合注意力机制与残差网络提取小目标多特征,减少复杂背景干扰;双向跨越连接结构融合低层与高层各自的特征信息,凸显小弱目标特征表达能力;增加一个高分辨率检测层,重新聚类弱小目标先验框,增强目标与背景的特征差别学习能力;最后,建立真实目标和预测目标框的高斯分布模型,计算两者相似性,解决因IoU度量造成的目标损失回归偏差敏感问题,提升损失回归准确性。在公开红外小目标数据集上进行对比测试,实验结果表明该算法对多种复杂背景下红外小弱目标检测均取得了最佳性能,在平均精度和速度等方面都得到显著提升,模型最小,方便部署。 展开更多
关键词 红外小目标 目标检测 跨越连接 注意力机制 多尺度融合
下载PDF
基于跨尺度相似先验的遥感图像时空融合算法
18
作者 方帅 万旗 曹洋 《电子学报》 EI CAS CSCD 北大核心 2024年第6期2037-2052,共16页
遥感卫星图像在空间分辨率和时间分辨率之间权衡导致图像序列的时空矛盾.时空图像融合提供了一个生成高空间分辨率和高时间分辨率图像的解决方案,以满足各种地球观测应用.基于稀疏表示的时空融合算法通过联合训练字典和稀疏编码表示建... 遥感卫星图像在空间分辨率和时间分辨率之间权衡导致图像序列的时空矛盾.时空图像融合提供了一个生成高空间分辨率和高时间分辨率图像的解决方案,以满足各种地球观测应用.基于稀疏表示的时空融合算法通过联合训练字典和稀疏编码表示建立高低空间分辨率图像之间的关系,为物候变化、类型变化等各种情况提供了统一的融合框架.然而,多源遥感图像来自于不同的传感器,高低空间分辨率图像之间关系模型暗含有传感器映射关系,导致模型设备依赖.针对该问题,本文提出将多源遥感图像时空融合过程分解为传感器偏差校正和时空融合两个子问题,即设备依赖部分和设备无关部分.传感器偏差校正部分可以作为时空融合预处理模块,提高融合精度,并且使得后续的融合模型更加具有普适性.当高低空间分辨率图像空间分辨率差异较大时,“高低空间分辨率图像稀疏系数一致”的假设带来的融合误差非常突出.针对该问题,本文提出基于跨尺度相似先验的遥感图像时空融合算法,利用跨尺度相似块构建稀疏结构先验的正则项,优化稀疏表示的目标函数,并构建中间尺度图像,降低跨尺度相似块的二义性.本文分别使用3组典型场景的实验数据集与其他算法进行对比,实验结果表明,在BOREAS数据集上,与次优的指标相比,本文算法的结构相似度(Structural SIMilarity,SSIM)提高了4.2%,光谱角(Spectral Angle Mapper,SAM)提高了4.6%;在CIA数据集上,与次优的指标相比,本文算法的SSIM提高了2.7%,SAM提高了12.8%;在LGC数据集上,与次优的指标相比,本文算法的SSIM提高了7.1%,SAM提高了16.3%;证明本文算法在空间和光谱特性上表现出优秀的特性. 展开更多
关键词 遥感 时空融合 稀疏表示 跨尺度相似
下载PDF
基于深度学习的三维肿瘤及器官分割
19
作者 顾德 王宁 +1 位作者 张寅斌 刘乐 《中国医学物理学杂志》 CSCD 2024年第9期1122-1128,共7页
针对三维医学图像中由于肿瘤或器官的形状、尺度差异较大导致分割精度较低的问题,提出一种端到端的三维全卷积分割模型。首先,设计空洞立方集成模块在不同分辨率阶段实现多尺度集成,增强复杂边界上的识别能力;其次,引入跨阶段上下文融... 针对三维医学图像中由于肿瘤或器官的形状、尺度差异较大导致分割精度较低的问题,提出一种端到端的三维全卷积分割模型。首先,设计空洞立方集成模块在不同分辨率阶段实现多尺度集成,增强复杂边界上的识别能力;其次,引入跨阶段上下文融合模块融合浅层和深层特征,促进收敛并更准确地定位目标对象;最后,解码器对来自编码器的特征进行拼接以实现分割。在脑肿瘤分割数据集上,平均Dice相似性系数值达到85.37%;在腹部器官分割数据集上,平均Dice相似性系数值达到83.99%。实验结果表明所提模型在三维肿瘤和器官的分割上具有较高精度。 展开更多
关键词 肿瘤分割 器官分割 三维卷积神经网络 空洞立方集成模块 跨阶段上下文融合模块
下载PDF
基于复合跨模态交互网络的时序多模态情感分析 被引量:1
20
作者 杨力 钟俊弘 +1 位作者 张赟 宋欣渝 《计算机科学与探索》 CSCD 北大核心 2024年第5期1318-1327,共10页
针对多模态情感分析中存在的不同模态间语义特征差异性导致模态融合不充分、交互性弱等问题,通过研究分析不同模态之间存在的潜在关联性,搭建一种基于复合跨模态交互网络的时序多模态情感分析(CCIN-SA)模型。该模型首先使用双向门控循... 针对多模态情感分析中存在的不同模态间语义特征差异性导致模态融合不充分、交互性弱等问题,通过研究分析不同模态之间存在的潜在关联性,搭建一种基于复合跨模态交互网络的时序多模态情感分析(CCIN-SA)模型。该模型首先使用双向门控循环单元和多头注意力机制提取具有上下文语义信息的文本、视觉和语音模态时序特征;然后,设计跨模态注意力交互层,利用辅助模态的低阶信号不断强化目标模态,使得目标模态学习到辅助模态的信息,捕获模态间的潜在适应性;再将增强后的特征输入到复合特征融合层,通过条件向量进一步捕获不同模态间的相似性,增强重要特征的关联程度,挖掘模态间更深层次的交互性;最后,利用多头注意力机制将复合跨模态强化后的特征与低阶信号做拼接融合,提高模态内部重要特征的权重,保留初始模态独有的特征信息,将得到的多模态融合特征进行最终的情感分类任务。在CMU-MOSI和CMUMOSEI数据集上进行模型评估,结果表明,CCIN-SA模型相比其他现有模型在准确率和F1指标上均有提高,能够有效挖掘不同模态间的关联性,做出更加准确的情感判断。 展开更多
关键词 跨模态交互 注意力机制 特征融合 复合融合层 多模态情感分析
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部