期刊文献+
共找到1,620篇文章
< 1 2 81 >
每页显示 20 50 100
基于条带池化与血管增强的眼底图像动静脉分类方法
1
作者 肖志涛 彭新文 +3 位作者 刘彦北 耿磊 张芳 王雯 《中国生物医学工程学报》 CAS CSCD 北大核心 2024年第4期438-446,共9页
视网膜血管动静脉管径比是定量分析糖尿病、高血压等慢性疾病的先决条件,是许多心血管疾病的重要风险指标。随着深度学习技术的发展,许多基于卷积神经网络的方法凭借其捕获高级语义的能力,在眼底图像动静脉分类方面取得了较大的进展。然... 视网膜血管动静脉管径比是定量分析糖尿病、高血压等慢性疾病的先决条件,是许多心血管疾病的重要风险指标。随着深度学习技术的发展,许多基于卷积神经网络的方法凭借其捕获高级语义的能力,在眼底图像动静脉分类方面取得了较大的进展。然而,这些方法大多是采用叠加局部卷积和池化操作方式,难以很好地应用于条带形状的眼底视网膜血管。在本研究中,为了更有效地提取条带形状的视网膜血管特征,引入条带池化来捕获空间像素远距离依赖关系,同时考虑到动静脉交错复杂的特性,结合空间金字塔池化并提出了一种全新的混合池化技术以扩大神经网络的感受野和学习上下文信息。另一方面,考虑到眼底图像中血管与非血管分布的比例极不平衡,引入了血管增强模块,利用血管分布信息和高斯核函数约束的血管边缘的信息作为权重校正动静脉特征抑制背景特征,进而解决血管与背景分布比例不平衡问题。在分别包含40、22、45张彩色眼底图像的3种国际公开数据集DRIVE、LES和HRF上的实验表明,所提算法的平衡精度(BACC)分别为0.955、0.946、0.967,表明本研究结合条带池化与血管增强的方法能够较好解决眼底图像中动静脉交错复杂和类别不平衡问题,实现对眼底视网膜动静脉的精确分类,具有较高的应用价值。 展开更多
关键词 眼底图像 动静脉分类 条带池化 混合池化 血管增强
下载PDF
基于自适应图卷积和注意力池化的点云分类与分割
2
作者 刘玉珍 张冬霞 陶志勇 《计算机工程与科学》 CSCD 北大核心 2024年第5期872-880,共9页
针对现有点云分类与分割方法使用最大池化聚合局部邻域特征,导致最大值以外的重要信息丢失的缺陷,提出一种结合自适应图卷积AdaptConv和注意力池化AP的点云分类与分割网络。首先,采用K近邻算法构建点云局部图结构,根据点的特征生成自适... 针对现有点云分类与分割方法使用最大池化聚合局部邻域特征,导致最大值以外的重要信息丢失的缺陷,提出一种结合自适应图卷积AdaptConv和注意力池化AP的点云分类与分割网络。首先,采用K近邻算法构建点云局部图结构,根据点的特征生成自适应卷积核,灵活精确地捕获点云的局部邻域特征;其次,为有效提高特征聚合能力,采用注意力池化定义能量函数得到权重值,加权并聚合出更具代表性的点云局部特征;最后,堆叠自适应图卷积和注意力池化逐层提取全局特征,提高网络的分类和分割精度。实验结果表明,相较基准方法,点云分类的平均类别精度提升0.9%,部件分割和语义分割的平均交并比分别提升0.8%和0.3%,证明所提方法可有效提升点云分类与分割的准确率,具有较高的鲁棒性。 展开更多
关键词 自适应图卷积 注意力池化 能量函数 最大池化
下载PDF
基于分形和分理论的分形池化算法
3
作者 肖莎莎 高哲 +2 位作者 贾凯 焦芷媛 柴浩宇 《微电子学与计算机》 2024年第7期1-7,共7页
传统池化操作既不能客观地评价池化区域中数据之间的差异性,也不能有效地保留池化区域中鉴别性特征。为解决这类问题,提出了一种基于分形和分理论,且能够根据每个特征图各通道中数据间的差异性,自行地选择最优池化策略的分形池化算法。... 传统池化操作既不能客观地评价池化区域中数据之间的差异性,也不能有效地保留池化区域中鉴别性特征。为解决这类问题,提出了一种基于分形和分理论,且能够根据每个特征图各通道中数据间的差异性,自行地选择最优池化策略的分形池化算法。首先,引入分形和分的定义,构造分形池化算子和训练误差的反向传播算法。该算子不仅包括最大池化、平均池化,还能够降低训练误差。然后,在算法实现的过程中,根据每个特征图各通道中数据间的差异性自适应地整定阶次,以确定池化区域中每个数据的训练权重。最后,在不同数据集和不同架构上进行了大量分类性能实验,验证了所提出的方法比传统池化方法和混合池化都取得了更好的分类效果。 展开更多
关键词 分形和分 最大池化 平均池化 分形池化 分类
下载PDF
基于知识图谱多集池化的健康状态智能评估方法
4
作者 张元鸣 肖士易 +2 位作者 徐雪松 程振波 肖刚 《计算机集成制造系统》 EI CSCD 北大核心 2024年第3期893-905,共13页
为了从装备传感器监测数据和其他关联数据中提取更全面的时间域和空间域特征信息,提出一种基于知识图谱多集池化的健康状态评估方法。构建了带时间标签的健康知识图谱,以建模装备一段时间内监测数据、部件组成数据和先验知识间的时空依... 为了从装备传感器监测数据和其他关联数据中提取更全面的时间域和空间域特征信息,提出一种基于知识图谱多集池化的健康状态评估方法。构建了带时间标签的健康知识图谱,以建模装备一段时间内监测数据、部件组成数据和先验知识间的时空依赖关系。在此基础上,设计了图多集池化网络模型,该模型通过节点特征学习、第一级图池化、自注意力特征学习和第二级图池化能够生成图谱的整体向量表示,将健康状态评估转换为基于表示学习的图谱分类任务。在公开的发动机数据集上对所提方法进行了实验评价,结果表明,该方法能够获得较高的评估准确度,在小样本情况下也表现出良好的优势。 展开更多
关键词 健康状态评估 图神经网络 知识图谱 时空特征 池化
下载PDF
城域池化波分解决方案及工程试点研究 被引量:1
5
作者 陆源 白立武 +2 位作者 张立明 孙梅 韩丽媛 《山东通信技术》 2024年第1期20-23,共4页
分析城域光传送网在适配全光算力底座架构演进中存在的问题,提出城域池化波分新型解决方案,对城域池化波分的四大关键技术进行总结,并给出应用场景及保护方案建议,最后结合某运营商工程试点进行测试研究。
关键词 池化波分 ROADM WSS 多环共享
下载PDF
联合多连接特征编解码与小波池化的轻量级语义分割
6
作者 易清明 王渝 +1 位作者 石敏 骆爱文 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期366-375,共10页
语义分割是当前场景理解领域的基础技术之一。现存的语义分割网络通常结构复杂、参数量大、图像特征信息损失过多和计算效率低。针对以上问题,基于编-解码器框架和离散小波变换,设计了一个联合多连接特征编解码与小波池化的轻量级语义... 语义分割是当前场景理解领域的基础技术之一。现存的语义分割网络通常结构复杂、参数量大、图像特征信息损失过多和计算效率低。针对以上问题,基于编-解码器框架和离散小波变换,设计了一个联合多连接特征编解码与小波池化的轻量级语义分割网络MLWP-Net(Multi-Link Wavelet-Pooled Network),在编码阶段利用多连接策略并结合深度可分离卷积、空洞卷积和通道压缩设计了轻量级特征提取瓶颈结构,并设计了低频混合小波池化操作替代传统的下采样操作,有效降低编码过程造成的信息丢失;在解码阶段,设计了多分支并行空洞卷积解码器以融合多级特征并行实现图像分辨率的恢复。实验结果表明,MLWP-Net仅以0.74 MB的参数量在数据集Cityscapes和CamVid上分别达到74.1%和68.2%mIoU的分割精度,验证了该算法的有效性。 展开更多
关键词 实时语义分割 轻量级神经网络 多连接特征融合 小波池化 多分支空洞卷积
下载PDF
基于金字塔池化网络的质子交换膜燃料电池气体扩散层组分推理方法
7
作者 王虎 尹泽泉 +6 位作者 王雯婕 黄笠舟 方宁宁 隋俊友 张加乐 张锐明 隋邦傑 《重庆大学学报》 CAS CSCD 北大核心 2024年第1期84-92,共9页
针对质子交换膜燃料电池气体扩散层(gas diffusion layer composition,GDL)形貌划分与制备工艺改进问题,提出了一种基于金字塔池化网络(pyramid scene parsing network,PSPNet)与多层感知器(multi-layer perception,MLP)的气体扩散层组... 针对质子交换膜燃料电池气体扩散层(gas diffusion layer composition,GDL)形貌划分与制备工艺改进问题,提出了一种基于金字塔池化网络(pyramid scene parsing network,PSPNet)与多层感知器(multi-layer perception,MLP)的气体扩散层组分识别与比例推理方法:首先将带标签的气体扩散层扫描电镜(scanning electron microscope,SEM)图片输入神经网络,得到特征图;得到的图像特征层进入金字塔池化模块后,获取SEM图像的深层和浅层特征;随后将深层和浅层特征图层融合输入全卷积网络(fully convolutional network,FCN)模块,得到预测图像;最后统计各个组分上的像素点比例,通过MLP完成组分比例推理。结果表明:所提方法组分识别像素准确率达81.24%;在5%偏差范围内,比例推理准确率为88.89%。该方法解决了气体扩散层多组分无法区分、比例无法获知的问题,可有效应用于气体扩散层的质检、数值重构以及制备工艺改进。 展开更多
关键词 质子交换膜燃料电池 气体扩散层制备 扫描电镜 人工智能 金字塔池化网络 多层感知器
下载PDF
金字塔方差池化网络的图像超分辨率重建
8
作者 彭晏飞 李泳欣 +1 位作者 孟欣 崔芸 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1380-1390,共11页
为减少高频信息丢失对图像重建造成的影响,进一步增强对特征信息的挖掘,以金字塔方差池化模块为核心构建了一个生成网络。首先,该网络利用不同级别的方差池化挖掘低分辨率图像蕴含的特征信息,并结合金字塔结构获取不同尺度与不同子区域... 为减少高频信息丢失对图像重建造成的影响,进一步增强对特征信息的挖掘,以金字塔方差池化模块为核心构建了一个生成网络。首先,该网络利用不同级别的方差池化挖掘低分辨率图像蕴含的特征信息,并结合金字塔结构获取不同尺度与不同子区域的上下文信息,从而进一步丰富特征信息量;然后,利用密集连接结构增强特征信息之间的关联性,以提高网络的表达能力;最后,引入组归一化操作来加强网络的收敛性。实验结果表明,该模型与其他方法在Set5、Set14、DIV2K100公开测试集上进行比较,在放大倍数因子为4时,峰值信噪比平均提高了0.509 dB,结构相似性平均提高了0.016。所提模型不仅在峰值信噪比和结构相似性上有一定的提高,其重建图像在视觉效果上也拥有更多的真实细节。 展开更多
关键词 图像超分辨率 生成对抗网络 方差池化 密集连接
下载PDF
基于比例池化的RGB图像语义分割网络
9
作者 李顺新 陈飞飞 《计算机技术与发展》 2024年第8期101-107,共7页
针对传统的金字塔多级特征融合算法进行语义分割时存在的特征图有效信息弱和噪声叠加效应等问题,提出一种基于比例池化的混合注意力机制。首先在主干网络特征输出处引入比例池化注意力模块对输入特征图进行不同程度的语义信息抽取和特... 针对传统的金字塔多级特征融合算法进行语义分割时存在的特征图有效信息弱和噪声叠加效应等问题,提出一种基于比例池化的混合注意力机制。首先在主干网络特征输出处引入比例池化注意力模块对输入特征图进行不同程度的语义信息抽取和特征降噪,突出特征图有效特征信息占比,随后将不同内核的池化结果作为级联金字塔结构的输入特征,对降噪后的多尺度特征进行融合,平滑图像噪声实现特征二次降噪和小目标物体语义信息增强。实验在Pascal VOC 2012数据集上验证了该方法在分割领域上的有效性,并采用平均像素准确率(mPA)和平均交并比(mIoU)作为模型的性能评估指标。实验结果表明,基于比例池化的金字塔网络在mPA和mIoU上达到了90.19%和79.92%,优于对比的语义分割方法。 展开更多
关键词 语义分割 比例池化 金字塔结构 多尺度特征融合 特征降噪
下载PDF
基于节点采样的子结构代表层次池化图卷积网络模型 被引量:1
10
作者 胡永利 李鸥宵 孙艳丰 《北京工业大学学报》 CAS CSCD 北大核心 2024年第6期693-701,共9页
为解决目前基于节点采样的图池化方法中所存在的评估节点重要性的策略过于简单以及子结构特征信息大量丢失等问题,提出了基于节点采样的子结构代表层次池化模型(sub-structure representative hierarchical pooling model based on node... 为解决目前基于节点采样的图池化方法中所存在的评估节点重要性的策略过于简单以及子结构特征信息大量丢失等问题,提出了基于节点采样的子结构代表层次池化模型(sub-structure representative hierarchical pooling model based on node sampling,SsrPool)。该模型主要包括子结构代表节点选择模块和子结构代表节点特征生成模块2个部分。首先,子结构代表节点选择模块同时考虑了节点特征信息以及结构信息,利用不同方法评估节点重要性并通过不同重要性分数协作产生鲁棒的节点排名以指导节点选择。其次,子结构代表节点特征生成模块通过特征融合保留局部子结构特征信息。通过将SsrPool与现有神经网络相结合,在不同规模公共数据集上的图分类实验结果证明了SsrPool的有效性。 展开更多
关键词 图神经网络 池化 节点重要性 图分类 层次化模型 图卷积神经网络
下载PDF
多尺度池化和双向特征融合的场景文本检测 被引量:2
11
作者 魏哲亮 李岳阳 罗海驰 《计算机工程与应用》 CSCD 北大核心 2024年第2期154-161,共8页
针对自然场景中文字背景复杂多样、形态大小各异的问题,提出了一种新的基于分割的场景文本检测网络。通过构建多尺度池化和双向特征融合两个模块来提升网络性能。根据文本实例的特点,多尺度池化模块使用不同长宽比窗口的空间池来捕获不... 针对自然场景中文字背景复杂多样、形态大小各异的问题,提出了一种新的基于分割的场景文本检测网络。通过构建多尺度池化和双向特征融合两个模块来提升网络性能。根据文本实例的特点,多尺度池化模块使用不同长宽比窗口的空间池来捕获不同距离上文本信息的依赖关系,指导网络得到更加准确的分割结果。双向特征融合模块构建了两条不同方向的融合路径,以更好地利用主干网络的不同尺度特征,提升网络对不同尺度文本的检测性能。实验结果证明了所提方法的有效性,在ICDAR2015、MSRA-TD500和Total-Text这三个公开数据集上,分别取得了87.7%、86.7%和85.5%的F-measure值。 展开更多
关键词 文本检测 图像分割 多尺度池化 双向特征融合
下载PDF
结合通道交互空间组注意力与金字塔池化的高分影像语义分割网络 被引量:2
12
作者 汪超宇 杜震洪 汪愿愿 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第2期131-142,152,共13页
高空间分辨率(高分)遥感影像中存在海量信息,因此对高分影像的语义分割研究十分重要。传统机器学习方法的语义分割精度和效率均不高,近年来,深度学习方法迅速发展,逐渐成为影像语义分割领域的常用方法,已有研究将SegNet、Deeplabv3+、U-... 高空间分辨率(高分)遥感影像中存在海量信息,因此对高分影像的语义分割研究十分重要。传统机器学习方法的语义分割精度和效率均不高,近年来,深度学习方法迅速发展,逐渐成为影像语义分割领域的常用方法,已有研究将SegNet、Deeplabv3+、U-Net等神经网络引入遥感影像语义分割,但效果有限。考虑高分影像的特性,对用于遥感影像语义分割的U-Net网络进行了改进。首先,在U-Net网络特征提取过程中使用通道交互空间组注意力模块(channel interaction and spatial group attention module,CISGAM),使得网络能够获取更多有效特征。其次,在编码过程中将普通卷积层变换为残差模块,并在U-Net的编码器和解码器之间用加入了CISGAM的注意力金字塔池化模块(attention pyramid pooling module,APPM)连接,以加强网络对多尺度特征的提取。最后,在0.3 m分辨率的UC Merced数据集和1 m分辨率的GID数据集上进行实验,与U-Net、Deeplabv3+等原始网络相比,在UC Merced数据集上的平均交并比(mean intersection over union,MIoU)分别提升了14.56%和8.72%,平均像素准确率(mean pixel accuracy,MPA)分别提升了12.71%和8.24%。在GID数据集的分割结果中,水体、建筑物等地物的综合分割精度大幅提升,在平均分割精度上,CISGAM和APPM较常用的CBAM和PPM有一定提升。实验结果表明,加入CISGAM和APPM的网络可行性与鲁棒性均较传统网络强,其较强的特征提取能力有利于提升高分辨率遥感影像语义分割的精度,为高分辨率遥感影像智能解译提供新方案。 展开更多
关键词 高分辨率遥感影像 深度学习 语义分割 注意力机制 金字塔池化
下载PDF
融合空洞空间金字塔池化和注意力的轻量化遥感影像道路提取 被引量:1
13
作者 刘志恒 岳子腾 +3 位作者 周绥平 江澄 节永师 陈雪梅 《航天返回与遥感》 CSCD 北大核心 2024年第1期111-122,共12页
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块... 针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35%、2.15%、4.1%、3.15%和14.34%,且减少了36.1%的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。 展开更多
关键词 道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像
下载PDF
基于图池化对比学习的图分类方法
14
作者 胡能兵 蔡彪 +1 位作者 李旭 曹旦华 《计算机应用》 CSCD 北大核心 2024年第11期3327-3334,共8页
在图分类任务中,现有的利用丢弃节点的图池化算法得到的图嵌入表示没有有效地利用丢弃节点蕴含的信息和图间节点信息,同时传统方法也没有针对图嵌入进行单独学习,限制了它在图分类任务上的部分性能。为克服上述传统方法的不足,提出一种... 在图分类任务中,现有的利用丢弃节点的图池化算法得到的图嵌入表示没有有效地利用丢弃节点蕴含的信息和图间节点信息,同时传统方法也没有针对图嵌入进行单独学习,限制了它在图分类任务上的部分性能。为克服上述传统方法的不足,提出一种有效利用丢弃节点信息的图嵌入方法——基于图池化对比学习的图分类方法(GPCL)。首先,利用图注意力机制学习每个节点相应的注意力分数,且根据注意力分数对节点进行排序并丢弃分数较低的节点;其次,将本图保留的节点作为正样本,将其他图被丢弃的部分节点作为负样本,而将图的嵌入表达作为目标节点,两两计算相似性分数,从而进行对比学习。实验结果表明:在D&D(Dobson PD-Doig AJ)、MUTAG、PROTEINS和IMDB-B数据集上,相较于仅使用注意力机制和分层池化的方法,GPCL在图分类任务上的准确率分别提升了5.79、15.54、5.42和1.75个百分点,验证了GPCL充分提高了图间信息的利用率,在图分类任务上表现良好。 展开更多
关键词 图分类 图对比学习 池化 图神经网络 无监督学习
下载PDF
基于双线性池化引导特征融合的轴承故障诊断算法
15
作者 陈毅朋 吴飞 周凯东 《航空发动机》 北大核心 2024年第5期145-152,共8页
为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数... 为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数等操作,提高信号处理后的振动谱图质量;对预处理后的信号数据进行傅里叶变换,计算出变换后的幅值和频率数据,并绘制对应的振动谱图;利用通道注意力和空间注意力改进Res2Net网络,提取不同关注点下的视觉特征,并基于双线性池化方法进行多特征融合;利用全连接和softmax函数构建分类头,实现轴承故障分类。结果表明:所提出的方法在凯斯西储大学轴承数据集以及德国Paderborn数据集中的精确率分别为98.22%、97.94%,在轴承故障诊断中,所提算法不仅在理论上融合了自动化控制理论与控制工程原理,而且在实践中验证了其在轴承故障诊断中的有效性,为实现轴承故障的早期预警和智能诊断提供了新的技术途径。 展开更多
关键词 滚动轴承 振动谱图 故障诊断 双线性池化 多特征融合
下载PDF
基于归纳学习图卷积和自注意力池化的图分类网络
16
作者 倪瑞智 王永平 +2 位作者 张晓琳 叶金辉 陶雪晴 《计算机应用与软件》 北大核心 2024年第10期177-183,共7页
针对图神经网络在大规模图上的分类表现不佳,无法快速形成未知节点和边的嵌入,并且容易丢失图重要特征等问题。提出一种基于归纳学习和自注意力池化相结合的图分类网络模型,一方面采用改进聚合函数后的归纳式学习方法对图的节点特征形... 针对图神经网络在大规模图上的分类表现不佳,无法快速形成未知节点和边的嵌入,并且容易丢失图重要特征等问题。提出一种基于归纳学习和自注意力池化相结合的图分类网络模型,一方面采用改进聚合函数后的归纳式学习方法对图的节点特征形成快速地嵌入,另一方面采用自注意力池化方法保留图的重要特征,最终采用适于提取大规模图信息的层次化结构框架进行下游图分类任务。实验结果表明,该网络模型在相同的公共数据集下,对比其他图分类模型有2%~10%左右精度的提高。 展开更多
关键词 图神经网络 图分类 自注意力池化 图卷积神经网络
下载PDF
基于多边形特征池化与融合的复杂文本检测
17
作者 张相南 高新波 田春娜 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期113-123,共11页
文本检测在图像理解中发挥着重要的作用。基于深度学习的文本检测是当前的主流算法,包括单阶段方法和双阶段方法两类,而且后者的检测精度往往高于前者。双阶段的检测方法通常包含感兴趣区域特征池化操作,为进一步的检测和识别任务提供... 文本检测在图像理解中发挥着重要的作用。基于深度学习的文本检测是当前的主流算法,包括单阶段方法和双阶段方法两类,而且后者的检测精度往往高于前者。双阶段的检测方法通常包含感兴趣区域特征池化操作,为进一步的检测和识别任务提供特定维度的局部区域特征。然而对于弯曲文本等复杂文本区域来说,现有的基于矩形感兴趣区域的池化方法不再适用,而基于点特征替代区域特征的方法又损失了空间信息。针对该问题,提出了一种基于多边形特征池化和Transformer的复杂文本区域检测方法。首先,将复杂文本区域检测中感兴趣区域进行多边形特征池化,将池化操作的区域形状从矩形拓展到多边形并且不需要借助其他形状进行拟合,即可将多边形区域对应的特征池化为固定维度的特征序列,避免了拟合过程中出现误差。进而,将池化后的特征视为具有空间关系的序列,然后利用Transformer融合视觉特征之间的上下文关系,降低训练难度,提升检测精确度。在包含弯曲文本等复杂文本情况的ICDAR2015、MLT、Total Text和CTW1500数据集上的测试实验结果表明,提出的双阶段检测算法能更好地提取感兴趣区域特征,并取得了比现有方法更好的检测结果。 展开更多
关键词 文本检测 双阶段方法 多边形 特征池化 TRANSFORMER
下载PDF
基于层级池化序列匹配的知识图谱复杂问答最优查询图选择方法
18
作者 王冬 周思航 +1 位作者 黄健 张中杰 《系统工程与电子技术》 EI CSCD 北大核心 2024年第8期2686-2695,共10页
在处理知识图谱复杂问答任务时,传统的查询图语义解析方法需要在排序阶段对大量结构复杂的候选查询图进行语义编码,用以获得各自多维特征表示。然而,在编码过程中采用的全局最大或平均池化操作通常存在对代表性特征提取能力不足的问题... 在处理知识图谱复杂问答任务时,传统的查询图语义解析方法需要在排序阶段对大量结构复杂的候选查询图进行语义编码,用以获得各自多维特征表示。然而,在编码过程中采用的全局最大或平均池化操作通常存在对代表性特征提取能力不足的问题。针对以上问题,提出一种基于层级池化序列匹配的最优查询图选择方法。在实现候选查询图的交互建模过程中,同时采用层级池化滑动窗口技术分层提取问句和查询图序列对的局部显著性特征与全局语义特征,使得到的特征向量更好地用于候选查询图的语义匹配打分。所提方法在两个流行的复杂问答数据集MetaQA和WebQuestionsSP上开展广泛实验。实验结果表明:引入层级池化操作能够有效提取复杂查询图序列的代表性语义特征,增强原有排序模型的交互编码能力,有助于进一步提升知识图谱复杂问答系统的性能。 展开更多
关键词 知识图谱复杂问答 查询图语义解析 层级池化 交互编码
下载PDF
基于全局频域池化的行为识别算法
19
作者 贾志超 张海超 +3 位作者 张闯 颜蒙蒙 储金祺 颜之岳 《计算机应用研究》 CSCD 北大核心 2024年第9期2867-2873,共7页
目前基于3D-ConvNet的行为识别算法普遍使用全局平均池化(global average pooling,GAP)压缩特征信息,但会产生信息损失、信息冗余和网络过拟合等问题。为了解决上述问题,更好地保留卷积层提取到的高级语义信息,提出了基于全局频域池化(g... 目前基于3D-ConvNet的行为识别算法普遍使用全局平均池化(global average pooling,GAP)压缩特征信息,但会产生信息损失、信息冗余和网络过拟合等问题。为了解决上述问题,更好地保留卷积层提取到的高级语义信息,提出了基于全局频域池化(global frequency domain pooling,GFDP)的行为识别算法。首先,根据离散余弦变换(discrete cosine transform,DCT)看出,GAP是频域中特征分解的一种特例,从而引入更多频率分量增加特征通道间的特异性,减少信息压缩后的信息冗余;其次,为了更好地抑制过拟合问题,引入卷积层的批标准化策略,并将其拓展在以ERB(efficient residual block)-Res3D为骨架的行为识别模型的全连接层以优化数据分布;最后,将该方法在UCF101数据集上进行验证。结果表明,模型计算量为3.5 GFlops,参数量为7.4 M,最终的识别准确率在ERB-Res3D模型的基础上提升了3.9%,在原始Res3D模型基础上提升了17.4%,高效实现了更加准确的行为识别结果。 展开更多
关键词 3D-ConvNet 人体行为识别 全局平均池化 离散余弦变换
下载PDF
基于全局滤波池化多关系Transformer网络的行人重识别
20
作者 焦传扬 丁学明 《控制工程》 CSCD 北大核心 2024年第5期912-919,共8页
行人重识别(Re-identification,ReID)的关键挑战之一是提取关键且鲁棒的特征,近年来,Transformer网络不断展现其在该问题上具有强大的特征提取和表达能力。针对传统Transformer网络局部信息获取不如卷积神经网络的问题,提出一个基于ReI... 行人重识别(Re-identification,ReID)的关键挑战之一是提取关键且鲁棒的特征,近年来,Transformer网络不断展现其在该问题上具有强大的特征提取和表达能力。针对传统Transformer网络局部信息获取不如卷积神经网络的问题,提出一个基于ReID的全局滤波池化多关系Transformer(Trans-global filter pooling multi relationship-ReID,TFMR)网络新型框架,解决了Transformer网络局部关系建模不够丰富的问题。多关系(multi relation,MR)网络考虑身体多个部位间的关系,使特征包含局部信息之间的联系,增强特征中行人生理结构的关联。同时设计了全局滤波池化(global filter pooling,GFP)模块,将其嵌入到Transformer网络中,降低图片中噪点的干扰并减少视图变化造成的特征偏差,从而获取人物图像中更清晰的全局特征,提升识别准确率。实验表明,模型在区分行人信息问题上具有高效性,在Market-1501、DukeMTMC-ReID和MSMT17数据集中优于其他模型。 展开更多
关键词 行人重识别 TRANSFORMER 全局滤波池化 多关系网络
下载PDF
上一页 1 2 81 下一页 到第
使用帮助 返回顶部