期刊文献+
共找到655篇文章
< 1 2 33 >
每页显示 20 50 100
Color-image encryption scheme based on channel fusion and spherical diffraction
1
作者 Jun Wang Yuan-Xi Zhang +2 位作者 Fan Wang Ren-Jie Ni Yu-Heng Hu 《Chinese Physics B》 SCIE EI CAS CSCD 2022年第3期276-284,共9页
A secure encryption scheme for color images based on channel fusion and spherical diffraction is proposed in this paper. In the proposed encryption scheme, a channel fusion technology based on the discrete wavelet tra... A secure encryption scheme for color images based on channel fusion and spherical diffraction is proposed in this paper. In the proposed encryption scheme, a channel fusion technology based on the discrete wavelet transformation is used to transform color images into single-channel grayscale images, firstly. In the process of transformation, the hyperchaotic system is used to permutate and diffuse the information of red–green–blue(RGB) channels to reduce the correlation of channels. Then the fused image is encrypted by spherical diffraction transform. Finally, the complex-valued diffraction result is decomposed into two real parts by the improved equal module decomposition, which are the ciphertext and the private key. Compared with the traditional color image encryption schemes that encrypt RGB channels separately, the proposed scheme is highly secure and robust. 展开更多
关键词 channel fusion hyper-chaotic system asymmetric encryption spherical diffraction
下载PDF
A Multi-Channel Fusion Based Newborn Seizure Detection
2
作者 Malarvili BalaKrishnan Paul Colditz Boualeum Boashash 《Journal of Biomedical Science and Engineering》 2014年第8期533-545,共13页
We propose and compare two multi-channel fusion schemes to utilize the information extracted from simultaneously recorded multiple newborn electroencephalogram (EEG) channels for seizure detection. The first approach ... We propose and compare two multi-channel fusion schemes to utilize the information extracted from simultaneously recorded multiple newborn electroencephalogram (EEG) channels for seizure detection. The first approach is known as the multi-channel feature fusion. It involves concatenating EEG feature vectors independently obtained from the different EEG channels to form a single feature vector. The second approach, called the multi-channel decision/classifier fusion, is achieved by combining the independent decisions of the different EEG channels to form an overall decision as to the existence of a newborn EEG seizure. The first approach suffers from the large dimensionality problem. In order to overcome this problem, three different dimensionality reduction techniques based on the sum, Fisher’s linear discriminant and symmetrical uncertainty (SU) were considered. It was found that feature fusion based on SU technique outperformed the other two techniques. It was also shown that feature fusion, which was developed on the basis that there was inter-dependence between recorded EEG channels, was superior to the independent decision fusion. 展开更多
关键词 EEG NEWBORN SEIZURE Detection MULTI-channel Feature fusion Decision/Classifier fusion
下载PDF
一种基于暗亮通道分割融合的低照度环境图像去尘雾及增强方法 被引量:1
3
作者 樊红卫 张超 +3 位作者 曹现刚 刘金鹏 张旭辉 赵寒 《煤炭学报》 EI CAS CSCD 北大核心 2024年第4期2167-2178,共12页
受煤矿井下粉尘、水雾和低照度环境影响,对皮带运输系统的监测图像精准识别极为困难。针对现有去尘雾方法的图像处理结果和效率欠佳的问题,提出一种基于暗亮通道分割融合的低照度环境图像去尘雾及增强方法。首先利用阈值分割结合伽马变... 受煤矿井下粉尘、水雾和低照度环境影响,对皮带运输系统的监测图像精准识别极为困难。针对现有去尘雾方法的图像处理结果和效率欠佳的问题,提出一种基于暗亮通道分割融合的低照度环境图像去尘雾及增强方法。首先利用阈值分割结合伽马变换修正通道差,解决因低照度环境影响导致的尘雾浓度较大区域与其他区域间像素值差异不明显的问题,修正后通过引导尘雾图像做引导滤波得到更加符合实际情况的全局大气光强;然后为解决暗通道先验在尘雾浓度较大区域失效问题,引入亮通道先验进行补充,使用通道分量来辅助暗通道及亮通道透射率融合,避免因多次分割而导致的边缘像素归属问题;最后将去雾后RGB图像转至HSV空间,对亮度分量进行直方图均衡化并将均衡化前后的亮度分量进行加权融合,采用客观指标评价,选择最优聚合权值进行聚合,同时考虑去雾过程中饱和度损失和亮度分量与饱和度分量间的相关性提出饱和度自适应矫正函数,对图像饱和度进行矫正,色调分量保持不变,随后将图像转回至RGB空间,得到亮度适中、信息保留丰富和色彩鲜艳的图像;为验证所提方法的有效性,采用主观视觉、客观指标和目标检测精度及置信度进行算法对比,实验结果表明所提方法在上述4个指标上均优于被对比算法,其图像细节保留丰富,图像视觉观感更佳。 展开更多
关键词 低照度 暗通道 亮通道 分割融合 图像去雾 图像增强
下载PDF
复杂战场环境下改进YOLOv5军事目标识别算法研究 被引量:2
4
作者 宋晓茹 刘康 +2 位作者 高嵩 陈超波 阎坤 《兵工学报》 EI CAS CSCD 北大核心 2024年第3期934-947,共14页
复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战... 复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战场军事单元的识别锚框进行重新聚类,以提升模型对于目标大小适应度,加速模型收敛;采用通道-空间并行注意力机制,增加模型对复杂战场环境下目标特征信息与位置信息关注度;在特征融合网络部分使用BiFPN以提升模型对于特征的融合能力与速度;采用Alpha_IoU损失函数加速模型收敛,解决当真实框与预测框重合时IoU计算退化问题。实验结果表明,在自建军事目标数据集下,改进算法与主流目标识别算法相比,在保证模型空间复杂度的同时,mAP值达到了90.17%。消融实验对比结果表明,改进后网络较原模型精度提升11.57%,具有较好的识别性能,能够为战场情报获取提供有效的技术支撑。 展开更多
关键词 军事目标识别 通道-空间并行注意力机制 特征融合 损失函数
下载PDF
双通道特征融合的真实场景点云语义分割方法
5
作者 孙刘杰 朱耀达 王文举 《计算机工程与应用》 CSCD 北大核心 2024年第12期160-169,共10页
真实场景点云不仅具有点云的空间几何信息,还具有三维物体的颜色信息,现有的网络无法有效利用真实场景的局部特征以及空间几何特征信息,因此提出了一种双通道特征融合的真实场景点云语义分割方法DCFNet(dual-channel feature fusion of ... 真实场景点云不仅具有点云的空间几何信息,还具有三维物体的颜色信息,现有的网络无法有效利用真实场景的局部特征以及空间几何特征信息,因此提出了一种双通道特征融合的真实场景点云语义分割方法DCFNet(dual-channel feature fusion of real scene for point cloud semantic segmentation)可用于不同场景下的室内外场景语义分割。更具体地说,为了解决不能充分提取真实场景点云颜色信息的问题,该方法采用上下两个输入通道,通道均采用相同的特征提取网络结构,其中上通道的输入是完整RGB颜色和点云坐标信息,该通道主要关注于复杂物体对象场景特征,下通道仅输入点云坐标信息,该通道主要关注于点云的空间几何特征;在每个通道中为了更好地提取局部与全局信息,改善网络性能,引入了层间融合模块和Transformer通道特征扩充模块;同时,针对现有的三维点云语义分割方法缺乏关注局部特征与全局特征的联系,导致对复杂场景的分割效果不佳的问题,对上下两个通道所提取的特征通过DCFFS(dual-channel feature fusion segmentation)模块进行融合,并对真实场景进行语义分割。对室内复杂场景和大规模室内外场景点云分割基准进行了实验,实验结果表明,提出的DCFNet分割方法在S3DIS Area5室内场景数据集以及STPLS3D室外场景数据集上,平均交并比(MIOU)分别达到71.18%和48.87%,平均准确率(MACC)和整体准确率(OACC)分别达到77.01%与86.91%,实现了真实场景的高精度点云语义分割。 展开更多
关键词 深度学习 双通道特征融合 点云语义分割 注意力机制
下载PDF
术前体位复位联合术中提拉复位辅助Mis-TLIF技术治疗峡部裂型腰椎滑脱
6
作者 陆联松 孙韶华 +2 位作者 李豪杰 胡勇 马维虎 《中国骨伤》 CAS CSCD 2024年第10期965-971,共7页
目的:探讨应用微创经椎间孔腰椎椎间融合术(minimally invasive transforaminal lumbar interbody fusion,Mis-TLIF)结合术前体位复位治疗峡部裂型腰椎滑脱的临床效果并总结其优点。方法:回顾性分析2016年7月至2022年7月收治的60例腰椎... 目的:探讨应用微创经椎间孔腰椎椎间融合术(minimally invasive transforaminal lumbar interbody fusion,Mis-TLIF)结合术前体位复位治疗峡部裂型腰椎滑脱的临床效果并总结其优点。方法:回顾性分析2016年7月至2022年7月收治的60例腰椎峡部裂型滑脱患者,其中男26例,女34例;年龄35~72(51.32±4.24)岁。依据手术方式分为观察组和对照组。观察组30例,男12例,女18例;年龄35~71(51.80±6.38)岁;病程12~60(24.17±1.98)个月;L4滑脱18例,L5滑脱12例;Meyerding分级Ⅰ度滑脱20例,Ⅱ度滑脱10例;采用术前体位复位联合术中撑开复位后经Quadrant通道Mis-TLIF。对照组30例,男14例,女16例;年龄36~72(50.00±4.24)岁;病程12~60(23.70±1.53)个月;L4滑脱16例,L5滑脱14例;Meyerding分级Ⅰ度滑脱19例,Ⅱ度滑脱11例;采用传统后路开放椎体融合术治疗。分析两组的手术时间、术中及术后出血量、术后住院时间、放射线暴露时间和并发症等方面的差异。采用视觉模拟评分(visual analogue scale,VAS)、Oswestry功能障碍指数(Oswestry disability index,ODI)及日本骨科协会(Japanese Orthopaedic Association,JOA)评分(腰椎评分标准)评估临床效果,随访复查X线及CT评估椎间融合情况。结果:所有患者获得12个月的随访。两组在手术时间、腰痛VAS、滑脱角、滑脱率等方面差异无统计学意义(P>0.05)。观察组术中术后出血量(165.50±15.56)、(59.17±10.59)ml,均少于对照组(259.33±35.32)、(165.33±29.56)ml(P<0.05);观察组住院时间(3.53±0.68)d,少于对照组(5.20±0.41)d(P<0.05);末次随访时两组椎间隙高度、滑脱角、滑脱率、ODI、VAS、JOA评分均较术前明显改善(P<0.05)。末次随访观察组与对照组ODI[(9.93±1.11)%vs(10.93±1.11)%]和JOA[(26.07±1.01)分vs(25.43±1.25)分]比较,差异有统计学意义(P<0.05)。结论:在峡部裂型腰椎滑脱的治疗中,术前体位复位联合术中提拉复位辅助Mis-Tlif技术相比传统开放性手术具有创伤小、出血少、住院周期短等优点,是一种安全有效的技术。 展开更多
关键词 峡部裂型腰椎滑脱 Mis-TLIF Quadrant通道 经椎间孔椎体融合术 体位复位
下载PDF
多尺度融合图像去雾方法
7
作者 邱云明 章生冬 +1 位作者 范恩 侯能 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第5期594-601,共8页
图像去雾能够使视觉系统适应不同的天气状况.为克服传统暗通道先验方法会在物体边界区域形成光晕效应的问题,提出一种用于估计有雾图像透射率的多尺度融合算法.应用不同大小的最小值半径得到多尺度的透射率估计值,再根据局部区域像素具... 图像去雾能够使视觉系统适应不同的天气状况.为克服传统暗通道先验方法会在物体边界区域形成光晕效应的问题,提出一种用于估计有雾图像透射率的多尺度融合算法.应用不同大小的最小值半径得到多尺度的透射率估计值,再根据局部区域像素具有类似的透射率值这一现象,对透射率图进行多尺度融合,选择小透射图区域中最亮的像素来计算大气光值,最后使用大气散射模型恢复清晰图像.分别从视觉效果和量化指标两个方面,对比所提方法与传统的基于先验和基于深度学习的去雾方法在进行图像去雾后的效果.结果发现,针对4种典型场景,采用本研究算法去雾后的重构图像能够保留更多的结构、细节和颜色信息,避免了过分增强和边缘部分的雾残留问题,视觉效果均优于对比方法;量化指标峰值信噪比和结构相似性均高于对比方法,分别为15.65和0.78. 展开更多
关键词 图像处理 图像去雾 暗通道 多尺度 融合方法 透视率图 图像增强 图像恢复
下载PDF
改进YOLOv8的农作物叶片病虫害识别算法
8
作者 张书贵 陈书理 赵展 《中国农机化学报》 北大核心 2024年第7期255-260,共6页
针对传统检测网络难以准确、高效地提取农作物叶片病虫害特征信息的问题,通过改进YOLOv8网络,提出一种多层级多尺度特征融合的农作物叶片病虫害识别算法。通过学习不同层级特征直接的特征关系,构建多层级特征编码模块,学习全面的特征表... 针对传统检测网络难以准确、高效地提取农作物叶片病虫害特征信息的问题,通过改进YOLOv8网络,提出一种多层级多尺度特征融合的农作物叶片病虫害识别算法。通过学习不同层级特征直接的特征关系,构建多层级特征编码模块,学习全面的特征表达;在Transformer的基础上设计多尺度空间—通道注意力模块,利用学习细粒度、粗粒度等多尺度全面的特征表达模式,捕获不同尺度特征之间的互补关系,并将所有特征表示有效融合起来,构成完整的图像特征表示,进而获取更佳的识别结果。在Plant Village公开数据集进行试验验证,结果表明:提出的改进方法能够有效提升配准精度,准确地识别出农作物叶片上同时存在的不同病虫害,对番茄叶片检测的mAP 0.5达到88.74%,比传统YOLOv8方法提升8.53%,且计算耗时没有明显增加。消融试验也充分证明所提各个模块的有效性,能够更好地实现高精度识别叶片病虫害,为农田智慧化管理提供有力支持和保障。 展开更多
关键词 叶片病虫害识别 多层级特征编码 多尺度特征融合 通道注意力 特征表达
下载PDF
基于多通道的语义信息融合交互方法
9
作者 王出航 陈丹 《长春工业大学学报》 CAS 2024年第2期160-163,共4页
提出一种基于多通道的语义信息融合交互方法,使用不同的网络结构来提取原始语音信息、图像信息以及行为信息的语义特征,通过隐马尔可夫模型加强不同特征之间的交互,使用注意力机制建立语义信息融合,捕获了深层语义特征。在IEMOCAP数据... 提出一种基于多通道的语义信息融合交互方法,使用不同的网络结构来提取原始语音信息、图像信息以及行为信息的语义特征,通过隐马尔可夫模型加强不同特征之间的交互,使用注意力机制建立语义信息融合,捕获了深层语义特征。在IEMOCAP数据集上验证了所提方法的有效性。 展开更多
关键词 多通道 语义特征 融合交互 注意力机制
下载PDF
基于注意力机制及多分支特征融合的实时语义分割算法
10
作者 蒋锐 陈儒娜 +2 位作者 王小明 李大鹏 徐友云 《南京邮电大学学报(自然科学版)》 北大核心 2024年第2期91-100,共10页
为了合理平衡语义分割中的精确度与实时性,基于快速卷积神经网络模型(Fast-SCNN)提出了一种基于注意力机制及多分支特征融合的实时语义分割算法模型。该算法模型首先通过注意力模块捕获空间特征之间的相互联系,增强空间细节信息;然后合... 为了合理平衡语义分割中的精确度与实时性,基于快速卷积神经网络模型(Fast-SCNN)提出了一种基于注意力机制及多分支特征融合的实时语义分割算法模型。该算法模型首先通过注意力模块捕获空间特征之间的相互联系,增强空间细节信息;然后合理设计融合模块,最大化利用各分支信息,实现深层特征与浅层特征更好的融合;最后引入自适应特征增强注意力模块,捕获长距离像素间的相互依赖关系。实验结果表明,文中算法模型在Cityscapes数据集上获得了71.55%的分割精度,推理速度FPS达到97.6帧/s,模型参数量为1.39 M,验证了该算法所构成网络模型的有效性。 展开更多
关键词 实时语义分割 通道注意力 空间注意力 特征融合 自适应注意力
下载PDF
特征融合的装修案例跨模态检索方法
11
作者 亢洁 刘威 《智能系统学报》 CSCD 北大核心 2024年第2期429-437,共9页
目前家装客服系统中主要依靠人工方式进行装修案例检索,导致该系统不能满足用户对咨询服务快捷、及时的需求而且人力成本高,故提出一种基于特征融合的装修案例跨模态检索算法。针对多模态数据的语义信息挖掘不充分,模型检索精度低等问题... 目前家装客服系统中主要依靠人工方式进行装修案例检索,导致该系统不能满足用户对咨询服务快捷、及时的需求而且人力成本高,故提出一种基于特征融合的装修案例跨模态检索算法。针对多模态数据的语义信息挖掘不充分,模型检索精度低等问题,对现有的风格聚合模块进行改进,在原始模块中引入通道注意力机制,以此来为每组装修案例中不同图片的特征向量添加合适的权重,从而增强包含更多有用信息的重要特征并削弱其他不重要的特征。同时,为充分利用多模态信息,设计一种适用于检索场景下的多模态特征融合模块,该模块能够自适应地控制2种不同模态的特征向量进行一系列的融合操作,以实现跨模态数据间的知识流动与共享,从而生成语义更丰富、表达能力更强的特征向量,进一步提升模型的检索性能。在自建的装修案例多模态数据集上将该方法与其他方法进行比较,试验结果表明本文方法在装修案例检索上具有更优越的性能。 展开更多
关键词 家装客服系统 装修案例检索 跨模态检索 风格聚合 多模态 特征融合 通道注意力机制 语义信息
下载PDF
Delta大通道内镜辅助下后路椎管减压椎间植骨融合术治疗退变性腰椎疾病的临床疗效
12
作者 陈云生 伍耀宏 +2 位作者 徐灿华 陈荣春 石江友 《中国脊柱脊髓杂志》 CAS CSCD 北大核心 2024年第7期704-710,共7页
目的:探讨Delta大通道内镜辅助下后路椎管减压椎间植骨融合术治疗退变性腰椎疾病的效果。方法:回顾性分析2021年9月~2022年9月我院收治的80例退变性腰椎疾病患者的病历资料,根据患者治疗方式分为观察组(38例,男17例,女21例,年龄61.0... 目的:探讨Delta大通道内镜辅助下后路椎管减压椎间植骨融合术治疗退变性腰椎疾病的效果。方法:回顾性分析2021年9月~2022年9月我院收治的80例退变性腰椎疾病患者的病历资料,根据患者治疗方式分为观察组(38例,男17例,女21例,年龄61.0±4.9岁)和对照组(42例,男20例,女22例,年龄60.5±5.4岁),观察组患者采取Delta大通道内镜下Endo-PLIF治疗,对照组采取开放后路腰椎椎间融合术治疗,记录两组患者术中出血量、术后引流量、手术时间、手术切口长度、住院时间,比较患者并发症发生情况。于术前、术后1周、1个月、3个月、6个月使用视觉模拟量表(visual analogue scale,VAS)评分评估患者腰痛情况,并采用Oswestry功能障碍指数(Oswestry disability index,ODI)评估患者腰椎功能;使用改良Macnab标准对患者进行疗效评估。根据患者术后1年随访时的腰椎影像学复查结果,使用Bridwell椎间融合标准对患者手术节段融合情况进行评估。结果:观察组患者的术中出血量及术后引流量分别低于对照组(88.46±10.98mL vs 112.99±12.01mL、159.73±18.42mL vs 201.36±23.06mL,P<0.05),手术切口及住院时间分别短于对照组(1.54±0.36cm vs 5.43±1.01cm、6.79±1.22d vs 8.03±1.43d,P<0.05),手术时间长于对照组(162.33±19.57min vs 126.87±23.15min,P<0.05)。80例患者术后均获随访,随访时间15~40个月(19.0±6.3个月)。观察组患者术后1周、术后1个月的VAS评分分别为2.46±0.51分、1.21±0.38分,ODI分别为(17.84±4.15)%、(10.69±1.88)%,均低于对照组[VAS评分分别为3.68±0.62分、2.01±0.41分,ODI分别为(21.33±3.48)%、(12.33±2.17)%,均P<0.05],两组患者术后3个月、术后6个月的VAS评分比较无统计学差异(P>0.05)。观察组治疗优良率为92.11%,与对照组的85.71%比较无统计学意义(P=0.487)。两组患者融合分级比较,差异无统计学意义(Z=0.487,P=0.624)。观察组术后并发症发生率为5.26%,与对照组的9.52%比较无统计学差异(P=0.678)。结论:Delta大通道内镜辅助下后路椎管减压椎间植骨融合术治疗退变性腰椎疾病效果良好,可以减少术中出血量,缩短手术切口和住院时间,更快改善患者术后短期内疼痛、腰椎功能,安全性较好。 展开更多
关键词 退变性腰椎疾病 后路内镜下融合术 Delta大通道内镜 疼痛 腰椎功能
下载PDF
基于双通道多特征融合的发电设备绿色节能控制方法研究
13
作者 喇元 王昕 +2 位作者 窦如婷 王宏 袁皓 《自动化仪表》 CAS 2024年第10期65-69,共5页
以往的发电设备绿色节能控制方法由于仅提取发电设备运行状态的功率特征,导致方法的控制效果较差。因此,设计了基于双通道多特征融合的发电设备绿色节能控制方法。首先,分析双通道多特征融合基本原理,利用传感器获取大量发电设备运行状... 以往的发电设备绿色节能控制方法由于仅提取发电设备运行状态的功率特征,导致方法的控制效果较差。因此,设计了基于双通道多特征融合的发电设备绿色节能控制方法。首先,分析双通道多特征融合基本原理,利用传感器获取大量发电设备运行状态数据,并对数据进行优化处理,以分析发电设备运行状态与能耗之间的关系。其次,构建发电设备运行状态数学模型,从中提取发电设备运行状态多个特征信息,并利用双通道结构对提取的特征信息进行融合。然后,设计双通道多特征融合控制策略,以融合提取的数据特征。最后,计算对应的控制参数,通过计算发电设备运行过程中的能耗阈值,制定对应的电力设备绿色节能控制策略。试验结果表明,与以往的发电设备绿色节能控制方法相比,所提方法在实际应用中节能效益最高可达44.5%。该方法具有节能效益高、易于操作和维护、实时性好和灵活性高等特点,在发电设备绿色节能控制领域具有广阔的应用前景。 展开更多
关键词 双通道多特征融合 发电设备 节能设备 绿色节能 控制方法 特征提取
下载PDF
改进YOLOv8的航拍图像小目标检测算法 被引量:5
14
作者 付锦燚 张自嘉 +1 位作者 孙伟 邹凯鑫 《计算机工程与应用》 CSCD 北大核心 2024年第6期100-109,共10页
针对在航拍图像检测任务中,物体和整体图像尺寸都比较小,尺度特征不一和细节信息不清晰,会造成漏检和误检等问题,提出了一种改进小目标检测算法CA-YOLOv8。设计了一种通道特征部分卷积模块CFPConv(chan-nel feature partial convolutio... 针对在航拍图像检测任务中,物体和整体图像尺寸都比较小,尺度特征不一和细节信息不清晰,会造成漏检和误检等问题,提出了一种改进小目标检测算法CA-YOLOv8。设计了一种通道特征部分卷积模块CFPConv(chan-nel feature partial convolution),基于此重新构造了C2f中的Bottleneck结构,命名为CFP_C2f,从而替换YOLOv8头部和颈部的部分C2f模块,增强有效通道特征权值,提升多尺度细节特征的获取能力。嵌入一种用以提升上下文聚合能力的模块CAM(context aggregated module),优化特征通道的响应,强化对深层特征的细节感知能力。添加NWD损失函数,将其与CIoU结合作为定位回归损失函数,降低位置偏差的敏感性。充分运用多重注意力机制的优势,把原有检测头替换为DyHead(dynamic head)。在VisDrone2019数据集的实验中,改进的算法较YOLOv8s原模型参数量降低了33.3%,检测精度mAP50值和mAP50:95分别提升了8.7和5.7个百分点,表现出良好的性能,验证了其有效性。 展开更多
关键词 小目标检测 YOLOv8算法 特征通道融合 多重注意力
下载PDF
基于双注意力机制的FMCW雷达人体行为识别
15
作者 卓智海 祝文胜 王双龙 《北京信息科技大学学报(自然科学版)》 2024年第5期58-66,共9页
为了提高调频连续波(frequency modulated continuous wave,FMCW)雷达人体行为识别的分类精度和泛化性能,提出了一种基于双注意力机制的特征融合方法。通过设置阈值,对距离-时间谱图和微多普勒谱图中的有效频谱进行提取、拼接后送入Alex... 为了提高调频连续波(frequency modulated continuous wave,FMCW)雷达人体行为识别的分类精度和泛化性能,提出了一种基于双注意力机制的特征融合方法。通过设置阈值,对距离-时间谱图和微多普勒谱图中的有效频谱进行提取、拼接后送入AlexNet和VGG16神经网络来提取特征;加入空间注意力和改进的通道注意力模块,丢弃冗余信息,以增强对重要信息的关注,获取更感兴趣的特征进行特征融合分类。实验结果表明,该方法对6种日常人体行为的平均识别准确率高达97.0%。 展开更多
关键词 调频连续波雷达 特征融合 通道注意力 空间注意力 人体行为识别
下载PDF
基于并行反向投影的图像超分辨率
16
作者 熊承义 李雪静 +2 位作者 高志荣 孙清清 刘川鄂 《中南民族大学学报(自然科学版)》 CAS 2024年第1期53-60,共8页
基于反向投影的残差特征提取与融合,可有效提升深度网络的特征提取能力,从而有益于改善图像的超分辨率重构性能.在此基础上提出了一种改进的采用并行反向投影策略的图像超分辨率深度网络,通过并行增强处于不同频段的高频特征,得到超分... 基于反向投影的残差特征提取与融合,可有效提升深度网络的特征提取能力,从而有益于改善图像的超分辨率重构性能.在此基础上提出了一种改进的采用并行反向投影策略的图像超分辨率深度网络,通过并行增强处于不同频段的高频特征,得到超分辨率性能的进一步提升.具体进行浅层特征提取后,网络经过多级的双路并行的反向投影特征增强模块.每一级模块中包含两个通路,分别采用顺序相反的上下采样,可同时得到处于不同频段的残差特征信息.通过对多级残差特征的融合,图像的高频特征得到不断的增强.同时网络引入了多尺度特征提取与通道注意力机制,以改进特征表达和学习能力.在多个公开的数据集上的大量实验结果表明,该方法可以有效提升超分辨率性能,并且在减少模型复杂度方面有一定的成效. 展开更多
关键词 单图像超分辨率 深度网络 并行反向投影 多尺度特征 注意力机制
下载PDF
多尺度特征金字塔融合的街景图像语义分割
17
作者 曲海成 王莹 +1 位作者 董康龙 刘万军 《计算机系统应用》 2024年第3期73-84,共12页
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失... 针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失的问题.然后利用层传递的迭代空洞空间金字塔,将自顶向下的特征信息依次融合,提高了上下文信息的有效交互能力;在多尺度特征融合之后引入属性注意力模块,使网络抑制冗余信息,强化重要特征.再者,以通道扩展上采样代替双线插值上采样作为解码器,进一步提升了特征图的分辨率.最后,LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%,与近几年网络模型相比,本文网络模型可以精确地提取像素的位置信息以及空间维度信息,提高了语义分割的准确率. 展开更多
关键词 语义分割 MDSDC IDCP-LC 属性注意力 通道扩展上采样 特征融合
下载PDF
改进的YoloV3轻量化多目标检测算法 被引量:1
18
作者 苏擎凯 童莹 +1 位作者 何睿清 曹雪虹 《计算机工程与设计》 北大核心 2024年第2期420-427,共8页
为有效解决轻量化目标检测网络降低参数量导致的检测精度损失问题,设计一种轻量化多目标检测网络MSPF-YoloV3,可以通过低分组数、低内存占用的通道混洗结构,达到与高分组数同样的信息交流的效果;将位置信息丰富的浅层特征与深层特征进... 为有效解决轻量化目标检测网络降低参数量导致的检测精度损失问题,设计一种轻量化多目标检测网络MSPF-YoloV3,可以通过低分组数、低内存占用的通道混洗结构,达到与高分组数同样的信息交流的效果;将位置信息丰富的浅层特征与深层特征进行融合,提高对不同大小目标的检测精度。经过实验验证了该方法的有效性与实时检测的能力。该网络在PASCAL VOC07+12数据集上的mAP达到86.31%;在COCO2014数据集中提取出与PASCAL VOC07+12数据集相同的20个类别,mAP达到67.71%;权重文件大小为46.8 MB,相较于YoloV3降低了198.2 MB;检测速度达到44 FPS。 展开更多
关键词 目标检测 轻量化 低分组数 低内存占用 通道混洗 特征融合 实时检测
下载PDF
基于多通道多步融合的生成式视觉对话模型
19
作者 陈思航 江爱文 +1 位作者 崔朝阳 王明文 《计算机应用》 CSCD 北大核心 2024年第1期39-46,共8页
当前视觉对话任务在多模态信息融合和推理方面取得了较大进展,但是,在回答一些涉及具有比较明确语义属性和位置空间关系的问题时,主流模型的能力依然有限。比较少的主流模型在正式响应之前能够显式地提供有关图像内容的、语义充分的细... 当前视觉对话任务在多模态信息融合和推理方面取得了较大进展,但是,在回答一些涉及具有比较明确语义属性和位置空间关系的问题时,主流模型的能力依然有限。比较少的主流模型在正式响应之前能够显式地提供有关图像内容的、语义充分的细粒度表达。视觉特征表示与对话历史、当前问句等文本语义之间缺少必要的、缓解语义鸿沟的桥梁,因此提出一种基于多通道多步融合的视觉对话模型MCMI。该模型显式提供一组关于视觉内容的细粒度语义描述信息,并通过“视觉−语义−对话”历史三者相互作用和多步融合,能够丰富问题的语义表示,实现较为准确的答案解码。在VisDial v0.9/VisDial v1.0数据集中,MCMI模型较基准模型双通道多跳推理模型(DMRM),平均倒数排名(MRR)分别提升了1.95和2.12个百分点,召回率(R@1)分别提升了2.62和3.09个百分点,正确答案平均排名(Mean)分别提升了0.88和0.99;在VisDial v1.0数据集中,较最新模型UTC(Unified Transformer Contrastive learning model),MRR、R@1、Mean分别提升了0.06百分点,0.68百分点和1.47。为了进一步评估生成对话的质量,提出类图灵测试响应通过比例M1和对话质量分数(五分制)M2两个人工评价指标。在VisDial v0.9数据集中,相较于基准模型DMRM,MCMI模型的M1和M2指标分别提高了9.00百分点和0.70。 展开更多
关键词 视觉对话 生成式任务 视觉语义描述 多步融合 多通道融合
下载PDF
基于文本和声学特征的双模态融合抑郁倾向识别算法
20
作者 赵健 崔骞 +1 位作者 石佳 刘岳 《计算机工程》 CAS CSCD 北大核心 2024年第11期49-58,共10页
在抑郁症诊断中,抑郁症患者的面部表情、声音信号和文字等数据可以作为评估抑郁倾向的客观指标。相较于视频,文本和音频模态在处理敏感的个人信息时能更好地保护患者的隐私,并且文本和音频均属于语言模态,相关性较强。针对抑郁倾向识别... 在抑郁症诊断中,抑郁症患者的面部表情、声音信号和文字等数据可以作为评估抑郁倾向的客观指标。相较于视频,文本和音频模态在处理敏感的个人信息时能更好地保护患者的隐私,并且文本和音频均属于语言模态,相关性较强。针对抑郁倾向识别中变长文本数据不易被分析以及手动提取音频特征存在局限性的问题,提出一种基于Transformer的融合网络优化方法。对于文本模态,使用卷积神经网络对文本进行特征提取,得到文本在不同尺度下的局部特征,然后引入Transformer模型来处理全局信息和长距离依赖。对于音频模态,为了降低手动提取音频特征对识别结果的影响,通过使用VGGish网络来自动提取音频特征,并将提取好的音频特征送入Transformer中。最后,为进一步增强文本和音频模态融合网络的识别性能,引入SE通道注意力机制,使模型能够自适应地调整各模态之间的权重分配,更有效地聚焦于关键特征。实验结果表明,双模态融合后的网络准确率达到92.7%,相比仅使用文本或音频模态,准确率分别提升2.9和4.9个百分点。 展开更多
关键词 Transformer模型 VGGish网络 双模态融合 抑郁倾向识别 SE通道注意力机制 深度学习
下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部