This paper proposes a PCA and KPCA self-fusion based MSTAR SAR automatic target recognition algorithm. This algorithm combines the linear feature extracted from principal component analysis (PCA) and nonlinear featu...This paper proposes a PCA and KPCA self-fusion based MSTAR SAR automatic target recognition algorithm. This algorithm combines the linear feature extracted from principal component analysis (PCA) and nonlinear feature extracted from kernel principal component analysis (KPCA) respectively, and then utilizes the adaptive feature fusion algorithm which is based on the weighted maximum margin criterion (WMMC) to fuse the features in order to achieve better performance. The linear regression classifier is used in the experiments. The experimental results indicate that the proposed self-fusion algorithm achieves higher recognition rate compared with the traditional PCA and KPCA feature fusion algorithms.展开更多
目的:颈前路减压融合术是治疗退行性颈椎病的经典手术方式,钉板的使用增加了融合率及稳定性的同时,间接导致了邻近椎体退变和术后吞咽困难的发生。文章通过Meta分析方法比较ROI-C^(TM)自锁系统和传统融合器联合钉板内固定治疗退行性颈...目的:颈前路减压融合术是治疗退行性颈椎病的经典手术方式,钉板的使用增加了融合率及稳定性的同时,间接导致了邻近椎体退变和术后吞咽困难的发生。文章通过Meta分析方法比较ROI-C^(TM)自锁系统和传统融合器联合钉板内固定治疗退行性颈椎病患者的临床结果和并发症情况,为颈前路减压融合术中内固定方式的选择提供循证学支持。方法:检索中国知网、万方、维普、PubMed、Cochrane Library、Web of Science和Embase数据库,检索关于颈前路减压融合术中应用ROI-C^(TM)自锁系统与融合器联合钉板内固定治疗退行性颈椎病的中英文文献。检索时间范围为各数据库建库至2023年7月。由2名研究者严格按照纳入与排除标准选择文献,采用Cochrane偏倚风险工具对随机对照试验进行质量评价,NOS量表对队列研究进行质量评价。采用RevMan 5.4软件进行Meta分析。结局指标包括手术时间、术中出血量、日本骨科协会(Japanese Orthopaedic Association Scores,JOA)评分、颈椎功能障碍指数、C_(2)-C_(7)Cobb角、融合率、邻近椎体退变发生率、融合器沉降率和吞咽困难发生率。结果:共纳入13项研究,其中回顾性队列研究11项,随机对照试验2项,共1136例患者,ROI-C组569例,融合器联合钉板组567例。Meta分析结果显示:ROI-C组与融合器联合钉板组在手术时间(MD=-15.52,95%CI:-18.62至-12.42,P<0.00001),术中出血量(MD=-24.53,95%CI:-32.46至-16.61,P<0.00001),术后邻近节段退变率(RR=0.40,95%CI:0.27-0.60,P<0.00001)和术后总吞咽困难发生率(RR=0.18,95%CI:0.13-0.26,P<0.00001)均具有显著性差异。两者在术后JOA评分、颈椎功能障碍指数、C_(2)-C_(7)Cobb角、融合率和融合器沉降率方面无显著性差异(P≥0.05)。结论:在颈椎前路减压融合术中应用ROI-C^(TM)自锁系统与传统融合器联合钉板内固定治疗退行性颈椎病均可达到满意的临床效果,ROI-C^(TM)自锁系统操作更加简单,相比融合器联合钉板内固定能明显减少手术时间及术中出血量,在减少术后吞咽困难及邻近节段退变发生率等方面具有明显优势,对于跳跃型颈椎病及邻椎病翻修患者,更加推荐使用ROI-C^(TM)自锁系统。但鉴于其可能存在较高的沉降率,对于多节段且合并融合器沉降高危因素如骨质疏松、椎体终板破损的退行性颈椎病患者,仍建议使用融合器联合钉板内固定。展开更多
针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷...针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷积神经网络和自注意力并行的双分支结构提取局部和全局特征,并加入空洞特征增强模块(DFM)减少深层特征图在降维过程中信息的丢失;上采样采用特征金字塔与多级注意力融合模块(MAFM)相结合的方式进行多级特征融合以增强文本特征间的潜在联系,通过文本检测器从上采样输出的特征图中检测文本组件;在链接关系预测网络中,采用基于图卷积网络的关系推理框架预测文本组件间的深层相似度,采用双向长短时记忆网络将文本组件聚合为文本实例。为验证RRNet的检测性能,构建了一个由商品包装图片组成的文本检测数据集(text detection dataset composed of commodity packaging,CPTD1500)。实验结果表明:RPTNet不仅在公开文本数据集CTW-1500和Total-Text上取得了优异的性能,而且在CPTD1500数据集上的召回率和F值分别达到了85.4%和87.5%,均优于当前主流算法。展开更多
为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征...为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征中的长期依赖关系,并强化网络对输入上下文信息的理解,本文提出了一种基于一维扩张卷积与Transformer的时域视听融合语音分离模型。将基于频域的传统视听融合语音分离方法应用到时域中,避免了时频变换带来的信息损失和相位重构问题。所提网络架构包含四个模块:一个视觉特征提取网络,用于从视频帧中提取唇部嵌入特征;一个音频编码器,用于将混合语音转换为特征表示;一个多模态分离网络,主要由音频子网络、视频子网络,以及Transformer网络组成,用于利用视觉和音频特征进行语音分离;以及一个音频解码器,用于将分离后的特征还原为干净的语音。本文使用LRS2数据集生成的包含两个说话者混合语音的数据集。实验结果表明,所提出的网络在尺度不变信噪比改进(Scale-Invariant Signal-to-Noise Ratio Improvement,SISNRi)与信号失真比改进(Signal-to-Distortion Ratio Improvement,SDRi)这两种指标上分别达到14.0 dB与14.3 dB,较纯音频分离模型和普适的视听融合分离模型有明显的性能提升。展开更多
针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature an...针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。展开更多
基金supported in part by the National Natural Science Foundation of China under Grant No. 61033012, No. 611003177, and No. 61070181Fundamental Research Funds for the Central Universities under Grant No.1600-852016 and No. DUT12JR07
文摘This paper proposes a PCA and KPCA self-fusion based MSTAR SAR automatic target recognition algorithm. This algorithm combines the linear feature extracted from principal component analysis (PCA) and nonlinear feature extracted from kernel principal component analysis (KPCA) respectively, and then utilizes the adaptive feature fusion algorithm which is based on the weighted maximum margin criterion (WMMC) to fuse the features in order to achieve better performance. The linear regression classifier is used in the experiments. The experimental results indicate that the proposed self-fusion algorithm achieves higher recognition rate compared with the traditional PCA and KPCA feature fusion algorithms.
文摘目的:颈前路减压融合术是治疗退行性颈椎病的经典手术方式,钉板的使用增加了融合率及稳定性的同时,间接导致了邻近椎体退变和术后吞咽困难的发生。文章通过Meta分析方法比较ROI-C^(TM)自锁系统和传统融合器联合钉板内固定治疗退行性颈椎病患者的临床结果和并发症情况,为颈前路减压融合术中内固定方式的选择提供循证学支持。方法:检索中国知网、万方、维普、PubMed、Cochrane Library、Web of Science和Embase数据库,检索关于颈前路减压融合术中应用ROI-C^(TM)自锁系统与融合器联合钉板内固定治疗退行性颈椎病的中英文文献。检索时间范围为各数据库建库至2023年7月。由2名研究者严格按照纳入与排除标准选择文献,采用Cochrane偏倚风险工具对随机对照试验进行质量评价,NOS量表对队列研究进行质量评价。采用RevMan 5.4软件进行Meta分析。结局指标包括手术时间、术中出血量、日本骨科协会(Japanese Orthopaedic Association Scores,JOA)评分、颈椎功能障碍指数、C_(2)-C_(7)Cobb角、融合率、邻近椎体退变发生率、融合器沉降率和吞咽困难发生率。结果:共纳入13项研究,其中回顾性队列研究11项,随机对照试验2项,共1136例患者,ROI-C组569例,融合器联合钉板组567例。Meta分析结果显示:ROI-C组与融合器联合钉板组在手术时间(MD=-15.52,95%CI:-18.62至-12.42,P<0.00001),术中出血量(MD=-24.53,95%CI:-32.46至-16.61,P<0.00001),术后邻近节段退变率(RR=0.40,95%CI:0.27-0.60,P<0.00001)和术后总吞咽困难发生率(RR=0.18,95%CI:0.13-0.26,P<0.00001)均具有显著性差异。两者在术后JOA评分、颈椎功能障碍指数、C_(2)-C_(7)Cobb角、融合率和融合器沉降率方面无显著性差异(P≥0.05)。结论:在颈椎前路减压融合术中应用ROI-C^(TM)自锁系统与传统融合器联合钉板内固定治疗退行性颈椎病均可达到满意的临床效果,ROI-C^(TM)自锁系统操作更加简单,相比融合器联合钉板内固定能明显减少手术时间及术中出血量,在减少术后吞咽困难及邻近节段退变发生率等方面具有明显优势,对于跳跃型颈椎病及邻椎病翻修患者,更加推荐使用ROI-C^(TM)自锁系统。但鉴于其可能存在较高的沉降率,对于多节段且合并融合器沉降高危因素如骨质疏松、椎体终板破损的退行性颈椎病患者,仍建议使用融合器联合钉板内固定。
文摘针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷积神经网络和自注意力并行的双分支结构提取局部和全局特征,并加入空洞特征增强模块(DFM)减少深层特征图在降维过程中信息的丢失;上采样采用特征金字塔与多级注意力融合模块(MAFM)相结合的方式进行多级特征融合以增强文本特征间的潜在联系,通过文本检测器从上采样输出的特征图中检测文本组件;在链接关系预测网络中,采用基于图卷积网络的关系推理框架预测文本组件间的深层相似度,采用双向长短时记忆网络将文本组件聚合为文本实例。为验证RRNet的检测性能,构建了一个由商品包装图片组成的文本检测数据集(text detection dataset composed of commodity packaging,CPTD1500)。实验结果表明:RPTNet不仅在公开文本数据集CTW-1500和Total-Text上取得了优异的性能,而且在CPTD1500数据集上的召回率和F值分别达到了85.4%和87.5%,均优于当前主流算法。
文摘为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征中的长期依赖关系,并强化网络对输入上下文信息的理解,本文提出了一种基于一维扩张卷积与Transformer的时域视听融合语音分离模型。将基于频域的传统视听融合语音分离方法应用到时域中,避免了时频变换带来的信息损失和相位重构问题。所提网络架构包含四个模块:一个视觉特征提取网络,用于从视频帧中提取唇部嵌入特征;一个音频编码器,用于将混合语音转换为特征表示;一个多模态分离网络,主要由音频子网络、视频子网络,以及Transformer网络组成,用于利用视觉和音频特征进行语音分离;以及一个音频解码器,用于将分离后的特征还原为干净的语音。本文使用LRS2数据集生成的包含两个说话者混合语音的数据集。实验结果表明,所提出的网络在尺度不变信噪比改进(Scale-Invariant Signal-to-Noise Ratio Improvement,SISNRi)与信号失真比改进(Signal-to-Distortion Ratio Improvement,SDRi)这两种指标上分别达到14.0 dB与14.3 dB,较纯音频分离模型和普适的视听融合分离模型有明显的性能提升。
文摘针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。